
。 这些小白核函数跑在gpu上。 每一个核函数运行实例,都独立对应一条运算线程。 开的时候,赵卫国可以写小白c/c++代码,搭配专属的语法和操作指令,来自定义编写和调用这些核函数。 不止如此,小白架构还搭了一整套完善的开工具链和函数资源库,专门针对gpu编程和并行计算的各种场景。 配套资源包括专用的编译器、调试工具、性能检测分析软件,还有各种专业化的数学函数库。 靠着这套辅助开工具,赵卫国写代码、调试、做性能迭代优化,效率高得不是一星半点,系统综合性能也被夯得死死的。 从芯片底层的架构原理来看,机器学习的核心运算其实就是大规模矩阵运算加多线程并行计算。 所以,适配这套智能系统的芯片...