马斯克旗下xAI公司发布Grok-2,AI新突破还是伦理危机?

图片来自网络

由马斯克创办的xAI公司在本周推出了Grok-2测试版,包括Grok-2和Grok-2 mini,这两款产品提供图像生成能力,并且已经向X平台的订阅用户开放使用。

在LMSYS平台的盲测中,Grok-2的表现优于Claude 3.5 Sonnet和GPT-4-Turbo,但在社群评比中排名第三,仅次于ChatGPT-4o和Gimini-1.5 Pro。不过,即便Grok-2在多个学术标准评估中表现良好,但用户发现其安全机制存在缺陷,会生成不当内容,例如允许生成特朗普持枪画面。

xAI曾以sus-column-r为名在LMSYS聊天机器人平台上进行测试,在1.2万名社群成员的投票中取得了第三名的成绩。Grok-2在研究生水平科学知识、常识和数学竞赛问题等领域的表现与GPT-4 Turbo、Claude 3 Opus及Gemini Pro 1.5等模型相当,并在视觉数学推理和基于文档的问题上提供了高性能。

目前,付费的X Premium和Premium+用户可以率先体验Grok-2和Grok-2 mini。xAI表示,Grok-2在各种任务上更为直观、通用且易于操作,同时整合了X平台上的即时信息。Grok-2 mini是精简版模型,在速度和品质之间进行平衡。xAI计划在8月通过新的企业API平台发布Grok-2和Grok-2 mini。

不过还是安全方面的问题,The Verge的测试发现,尽管Grok-2承诺做了安全设置,可以避免生成色情、暴力、仇恨或危险图片,但很多无理生成请求不可避免,这也是我们未来需要思考的问题——如何去尝试解决此类危机。