herrDeng網內搜尋

自訂搜尋

Ads

2017年1月17日 星期二

Use cuda C to test Matrix multiplication(測試矩陣乘法)



平行計算cuda C測試矩陣乘法,比起CPU計算,要快上95倍以上。



cuda C部份的矩陣乘法,採tiled version,每個block為32x32。

簡談CUDA C

沒有留言:

Related Posts Plugin for WordPress, Blogger...

熱門文章