微软Copilot+PC:让生产力飞速增长

微软Build 2024大会刷屏,再次谈到Windows和AI话题,推出新型Windows PC即 “Copilot+PC”,Recall等可圈可点的生成式AI功能引发热议。

微软计划将AI Agent投入实际工作

据微软表示,Copilot AI Agent很快可以被投入业务使用,企业可以利用它们执行监控电子邮件、自动化任务序列、员工入职辅助或数据输入等琐碎任务,无需手动触发。微软强调新的Copilot功能不会取代人类工作,而是替代其中枯燥乏味的部分。

微软推出多模态小模型

微软此次推出了Phi-3-vision,这是在4月份宣布的Phi-3 AI模型的新版本。它是多模态的,可以读取文本和查看图片,但它是一个尺寸较小的语言模型,紧凑到可以在移动设备上运行。图像分析是AI公司一直在推动的一大用例,而智能手机是使用它们的理想场所之一。Phi-3-vision是微软在4月份宣布的Phi-3系列模型中的一部分,现已在预览版中可用。

Microsoft Edge可以在看视频的同时将其翻译成其他语言微软的Edge浏览器即将推出一项基于AI的实时视频翻译功能,可以为视频网站、社交网站的视频添加字幕,可实现从西班牙语到英语或相反的翻译,或从英语到德语、印地语、意大利语和俄语的翻译。微软表示该功能“即将推出”,并表示未来将添加更多语言和视频平台。

Windows 11的PowerToys添加基于AI的剪贴板功能

微软的新型高级粘贴功能现已作为Windows 11的PowerToys套件的一部分推出,使您能够在粘贴内容时对其进行转换。可以通过按下Windows键+Shift+V来触发高级粘贴菜单,然后使用进一步的键盘快捷键将粘贴的内容转换为纯文本、Markdown或JSON等格式。用户还可以通过在提示框中输入来进行转换,该提示框还具有其他功能,例如在粘贴之前修改或总结文本。需要注意的是,需要在OpenAI帐户中拥有AI部分的API密钥和信用额度。

开发Recall,重塑Windows AI

微软表示,Recall是为高性能的新型Copilot+个人电脑设计的人工智能功能之一,它就像给用户提供了“过目不忘的记忆”。

微软将在Windows 11中引入一项新的人工智能搜索功能,使用户可以在他们访问过的任何应用程序中查找和检索信息。

这项名为Windows Recall的新功能,本质上是记录用户在电脑上的所有操作,每隔5秒拍一次屏幕快照。这使Recall可生成一个可搜索的时间轴,包括用户与之交互的所有内容,包括应用程序、网站、文档和图像等等。

商业咨询公司J. Gold Associates的首席分析师Jack Gold表示: “如果Recall的效果和计划一样好,它将是一个重要的生产力助推器,可能是我们多年来看到的最有用的生产力工具之一。”

值得一提的是,OpenAI CEO Sam Altman在现场透露了有关GPT-5的消息,他不是来微软Build大会宣布新模型,而是因为微软为此项工作建造了一台更大的超级计算机,Sam Altman暗示新的模态和整体智能将是OpenAI下一款模型的关键。