1、微软上线新版必应预览
新版本的必应结合了ChatGPT的能力,展示ChatGPT和搜索引擎结合的用法。搜索引擎擅长根据关键词提供相关链接,而整合ChatGPT后,能根据语义信息,根据网络上看到的信息,生成一个有概括性的答案。
与ChatGPT不同的是,新版本Bing的回答附带有链接信息,有内容出处作为补充或者佐证,从而提升生成内容的可信度。
彼时,必应主页上只展示了12个Demo,大致介绍了新版本Bing的主要功能和主要用法。但已经足够让全世界热切关注微软必应,这也是微软作为OpenAI金主使用的一次优先特权,此后一个月,OpenAI才发布与其功能相同的GPT-4。
2023年11月,微软宣布 Bing Chat 及其企业高级版 Bing Chat for Enterprise 正式更名为 Copilot,与 ChatGPT 相似,微软的 Copilot 也拥有自己的网站。不过Copilot 提供 GPT-4、DALL·E 3 等强大功能,并且是全部免费,只需登录微软账号,而 ChatGPT 则需订阅会员。
新版本必应也是搜索引擎与AI的首次成功结合,奠定了搜索引擎未来变革新方向,值得关注
2、OpenAI发布GPT-4模型
相比之前的GPT模型在多项性能指标上都有显著提升。GPT-4有强大的识图能力,文字输入限制也提升至2.5万字,回答准确性也有显著提升,还能够生成歌词、创意文本从而实现风格变化,在各类专业测试及学术基准上也表现优良。并且当任务复杂度足够高的时候,GPT-4具备更可靠、更具创造性的特点,且能够处理更细致的指令。
以同等要求生成一篇文章对比GPT-3.5和GPT-4的区别,GPT-3.5是各种词汇的堆叠,语意不通,即便要求修改也是要求重组,冗词赘句。而GPT-4则可以有逻辑地组织文章,通过已有信息以及联网查询信息组合生成一篇相对完整的文章。
11月,OpenAI 首次开发者大会上,推出 GPT-4 Turbo,迄今为止最强GPT。其拥有高达 128K 的上下文限制,这意味着它能够一次性处理超过 300 页的文本,约等于 100,000 个汉字;它的训练数据包括了直至 2023 年 4 月的知识;在成本方面,与 GPT-4 相比,GPT-4 Turbo 在输入方面的成本减少了三分之二,在输出方面减少了一半。GPT-4 Turbo 同时在函数调用、执行指令以及 JSON 格式处理方面进行了专门的优化。
OpenAI一直以来表现都是令人惊艳的。
3、谷歌推出PaLM模型
由于GPT-4展现出的超强实力,也让我们在2023年看到了谷歌 AI的疯狂进化,GPT-4发布不久,谷歌也推出了大型多模态语言模型Pathways Language Model(PaLM)。4月份,谷歌宣布合并Alphabet子公司DeepMind,就是研究阿尔法狗的那家,以及谷歌研究院的谷歌Brain部门,成立新事业群谷歌DeepMind,全力开发AI技术。
此后谷歌正式推出PaLM 2 ,是5400亿参数量大模型PaLM的迭代版,基于100多种语言数据上训练而成,并完全开放了自己的聊天机器人Bard 的使用权限,但对比来说Bard答题正确率和创新性比GPT-4差挺多。
不过最近谷歌发布的多模态模型Gemini(双子座),ChatGPT可以理解静态的图片和文字,这个模型更酷,可以实时理解、操作和组合不同类型的信息,除了文本、代码、图片,还有动态的音频和视频。不过真正对标GPT-4的Gemini Ultra要到明年年初才正式上线,值得关注。
4、Stability AI发布开源大语言模型
2023年4月,开发AI图像生成工具Stable Diffusion的创业公司Stability AI宣布,发布并开源该团队训练的大语言模型StableLM。根据该团队的公告,StableLM的“阿尔法版本”中拥有30亿和70亿参数的模型已经可以从GitHub等开源平台上下载,后续还将推出150亿至650亿参数的版本。与Stable Diffusion类似,StableLM同样支持知识共享4.0协议,开发者可以在遵守协议的情况下,将这个模型用于商业或研究活动。
同年7月份Stability AI宣布推出最新的图像生成模型Stable Diffusion XL 1.0,Stable Diffusion XL 1.0包含35 亿个参数,能在“几秒钟内”生成多种长宽比的100 万像素分辨率的完整图像。
该事件也代表了人工智能领域,尤其在提供高质量、开源和易于访问的大型语言模型上的一个重要转变。
5、AI生成图像开始随处可见
在2022年,生成式AI生成的人物图片,脸还是一张大饼,眼睛可能挂在下巴上也可能没有,但是2023年,人们开始使用AI 生成器 Midjourney 创作AI图片,更加真实和具有欺骗性。比如4月,在推特上很出圈的一张恶搞传闻中的川普被捕图,感兴趣可以自己搜一下,相当真实… 当强大的图像生成器与敏感主题混合,比如政治、健康、战争等相关的主题,风险都可能是极端的。 AI生成的图像在这一年中也变得越来越普遍,甚至比真实图像更早出现在搜索引擎的结果中,这也是2023年多个事件引发的情况。
6、国内首个针对AIGC的政策出台
2023年7月,国家网信办等多部门公布了《生成式人工智能服务管理暂行办法》,成为国家首次针对于当下爆火的生成式人工智能产业发布规范性政策。
《办法》提出国家坚持发展和安全并重、促进创新和依法治理相结合的原则,采取有效措施鼓励生成式人工智能创新发展,对生成式人工智能服务实行包容审慎和分类分级监管,明确了提供和使用生成式人工智能服务总体要求。提出了促进生成式人工智能技术发展的具体措施,明确了训练数据处理活动和数据标注等要求。规定了生成式人工智能服务规范,明确生成式人工智能服务提供者应当采取有效措施防范未成年人用户过度依赖或者沉迷生成式人工智能服务,按照《互联网信息服务深度合成管理规定》对图片、视频等生成内容进行标识,发现违法内容应当及时采取处置措施等。此外,还规定了安全评估、算法备案、投诉举报等制度,明确了法律责任。
7、生成式AI创造的视频诞生
2023年7月,《冰霜》(The Frost)是一部完全由DALL-E 2创作的12分钟电影。这部电影由影片创作公司Waymark制作,Waymark采用了执行制片人兼导演撰写的剧本,并将其输入到OpenAI的图像生成模型DALL-E 2中。经过一些尝试和调整后,让模型产生了符合他们满意的风格的图像。制片人使用DALL-E 2生成了每一个镜头,接著他们使用D-ID的AI工具,对静止图像加入动态,像是眨眼或是让嘴唇移动,短篇的出现也标志着AI在创意产业的新里程碑。
8、全球首部全面监管AI欧盟版《人工智能法案》发布
2023年12月,欧洲议会、欧盟成员国和欧盟委员会三方在12月就《人工智能法案》达成协议。该法案按照不同的风险类别为人工智能技术应用进行了分类,从“不可接受”,也就是必须禁止的技术,到高、中、低风险的人工智能等,通过识别不同风险来进行监管。
严格禁止“对人类安全造成不可接受风险的人工智能系统”,其中包括有目的地操纵技术、利用人性弱点或根据行为、社会地位和个人特征等进行评价的系统等。
人工智能公司要对其算法进行人为控制,提供技术文件,并为“高风险”应用建立风险管理系统。每个欧盟成员国都将设立一个监督机构,确保这些规则得到遵守。
生成式人工智能,也就是包括ChatGPT在内的模型,也需要遵守新的透明度要求。欧盟要求其在投放市场前起草技术文件、遵守欧盟版权法等。