使用论坛账号
只需一步,快速开始
扫一扫,极速登录
你见过 50 分钟训练 BERT-Large、80 亿参数量训练 GPT-2 吗?快看看经过 CUDA 优化的 Transformer 为什么这么强。
举报
本版积分规则 发表回复 回帖后跳转到最后一页
欢迎关注易德轩公众号
回手机版|论坛帮助|易德轩网 ( 鲁ICP备20005112号-2 )|网站地图
GMT+8, 2024-11-28 02:18
Powered by Discuz! X3.4
Copyright © 2001-2021, Tencent Cloud.