长治股票配资 开源大模型新王干翻GPT4o,新技术可自我纠错,数学99刷爆测试集
2024-10-19开源大模型王座突然易主,居然来自一家小创业团队,瞬间引爆业界。 新模型名为Reflection 70B,使用一种全新训练技术,让AI学会在推理过程中纠正自己的错误和幻觉。 比如最近流行的数r测试中,一开始它犯了和大多数模型一样的错误,但主动在标签中纠正了自己。 在官方评测中,70B模型全面超越最强开源Llama 3.1 405B、GPT-4o、Claude 3 Opus、Gemini 1.5 Pro,特别是数学基准GSM8K上直接刷爆,得分99.2%。 这个结果也让OpenAI科学家、德扑AI