在单个 H200 上训练了 800k 参数,持续 2 小时 30 分钟