微信登录,快人一步
只需一步,快速开始
你见过 50 分钟训练 BERT-Large、80 亿参数量训练 GPT-2 吗?快看看经过 CUDA 优化的 Transformer 为什么这么强。
举报
本版积分规则 发表回复 回帖后跳转到最后一页
回手机版|论坛帮助|易德轩网 ( 苏ICP备2022008325号-4 )
GMT+8, 2025-1-31 15:50
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.