4月23日下午,在2024年商汤技术交流日上,商汤科技正式发布“日日新5.0”大模型,该模型采用MoE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,知识、推理、数学、代码全面对标GPT-4 Turbo。

4月23日下午,在2024年商汤技术交流日上,商汤科技正式发布“日日新5.0”大模型,该模型采用MoE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,知识、推理、数学、代码全面对标GPT-4 Turbo。
Previous: 军工信息化概念反复活跃,广哈通信20CM2连板
Next: 华为鸿蒙智行软件著作权获批