/* 自定義代碼塊樣式 */
Herr Deng桑的教學blog
這是Herr Deng桑的教學blog,主要處理作業與班導事務,另外還有數位小品。
網頁
首頁
密碼學
程式設計Programming
APP
計算機概論
herrDeng網內搜尋
自訂搜尋
Ads
2017年1月17日 星期二
Use cuda C to test Matrix multiplication(測試矩陣乘法)
平行計算cuda C測試矩陣乘法,比起CPU計算,要快上95倍以上。
cuda C部份的矩陣乘法,採tiled version,每個block為32x32。
簡談CUDA C
沒有留言:
張貼留言
較新的文章
較舊的文章
首頁
訂閱:
張貼留言 (Atom)
熱門文章
11!=?
11!=?
產生50個元素的陣列並排序
產生50個元素的陣列並排序
作業 3
請輸出如下 * ** *** **** ***** ******
作業4:複利計算
借錢500萬,年利18%,每月複利計算,請問連本帶利的金額 5, 10, 15, 20, 25, 30, 35, 40, 45, 50年的金額。並比較公式: A*exp(0.18n) A*(1+0.18/12)^(12*n), n=年數, A=本金 hint: math.h, p...
何謂public-key密碼系統?....
何謂public-key密碼系統? 何謂secret-key密碼系統? 各列舉五種!
Ex2 請問你所使的電腦的規格
請問你所使的電腦,CPU的規格 Cache多大?其他硬體配置...... 另外, "INTEL® XEON PHI™ 處理器 7230F"的大致規格為?
計算你上學期加權平均
計算你上學期加權平均
計算你的BMI
計算你的BMI
寫一個是否上學期成績2/3的程式
寫一個是否上學期成績2/3的程式
ex3 請用CPU-Z軟體檢測Cache & Memory
請用CPU-Z軟體檢測Cache & Memory 註:快取(L1-L3: SRAM) 第一級快取(L1)–通常存取只需要幾個週期,通常是幾十個KB。 第二級快取(L2)–比L1約有2到10倍較高延遲性,通常是幾百個KB或更多。 第三級快取(L3)(不...
沒有留言:
張貼留言