谁也没有想到,就在短短的两个月里,AI 技术就突飞猛进:微软推出集成了 GPT-4 的 New Bing 搜索引擎,还把 AI 技术集成到 Office 全家桶里;百度也效仿 ChatGPT,推出了文心一言等产品。
(相关资料图)
而在昨晚,AI 界又爆发了“大跃进”,英伟达发布了核弹级的新显卡,剑指 ChatGPT 底层架构;PS 祖师爷 Adobe 推出新 AI 应用,帮助设计师用几句话就能做出精美绝伦的图片;谷歌也宣布自家类 ChatGPT 应用“Bard”公测,AI 市场已经成了巨头的竞技场。
Adobe 的 Firefly 让一大批设计师下岗
作为 Photoshop (PS)的开发商,软件公司 Adobe 今日推出了一系列新的人工智能工具,名为 Firefly,这是一个新的创造生成性 AI 模型系列,专注于图像生成和文本效果,旨在帮助创意专业人士和艺术家生成图像和艺术文字。
截图自Adobe
Adobe 表示,Firefly 可以根据用户的文字描述生成图像、文本效果和风格。Firefly 是基于生成对抗网络(GAN)技术开发的,它利用了 Adobe Stock 授权的图像、开放许可的内容和版权已过期的公共领域内容来训练 AI 模型,因此不存在法律风险。
今天 Adobe 发布了一个宣传视频,对 Firefly 生成式 AI 工具系列的首批两款产品进行测试。
第一款工具的重点是创建图像和文本效果。例如,Adobe 展示了如何使用该工具生成不同版本的灯塔,只需突出多层艺术作品中的一个元素。除此之外,用户可以输入「给我一只后现代风格的鸟」来直接获取由 AI 生成的图片,并进行下一步的编辑,例如替换背景等。
截图自Adobe
另一个工具则根据提示为文字应用样式,让人们可以创建看起来毛茸茸、鳞片状或其他任何想要的效果的字母。
截图自Adobe
Firefly 目前处于测试阶段,用户可以申请加入测试计划,体验 Firefly 在 Photoshop、Illustrator、Express 和 Experience Manager 等应用中的功能。未来,Firefly 还将拓展到视频、营销和 3D 建模等领域。
现在 Firefly 还只能在 Adobe 的网站上使用,但公司计划将其集成到其软件中,从其 Photoshop 图像编辑软件、Illustrator 设计软件和 Adobe Express 快速视频制作软件开始。该公司尚未透露新工具的定价。
Adobe 认为人工智能不会取代创意人才,而是会提升他们的竞争力和创造力。公司还注意到了人工智能可能带来的法律和社会问题,比如版权侵权、偏见和刻板印象。因此,Adobe 使用了自己的图库、公共领域和授权作品来训练 Firefly,并避免了使用有版权、有商标或有敏感内容的图像。
谷歌的Bard“坑害亲爹”
谷歌在 2 月份发布了其 Bard 对话式 AI 后,一直在努力改进聊天机器人的回答,因为它在 Twitter 上首次亮相时就对提问者给出错误信息,这还导致谷歌当时股价暴跌。
最近谷歌公司正在将生成式 AI 功能添加到几乎所有服务中,而对 Bard 聊天机器人的访问仍然是少数人的专属。
IT之家注意到,昨天一些 Pixel 用户收到了测试谷歌 Bard 的邀请,今天该公司正式“开始开放对 Bard 的访问”,美国和英国的用户已可以加入候选名单。
图源IT之家App
就像 ChatGPT 或微软的 Bing 聊天一样,用户可以使用自然语言像与朋友交谈一样与 Bard 交谈。
“你可以要求 Bard 给你一些提示,以实现你今年阅读更多书籍的目标,用简单的术语解释量子物理学,或者通过概述博客文章来激发你的创造力”,谷歌的一位高管表示。“Bard 是一个 LLM(大型语言模型),我们认为它是对谷歌搜索的一种补充体验。”
根据公告中包含的屏幕截图,Bard 的界面看起来与 Bing AI 相当相似,但有几个关键区别。
在每个回答下方,Bard 提供了四个按钮:赞、踩、刷新和一个“Google it”的按钮。Bing AI 没有这些功能,而是使用回答下方的空间作为源引用区域。
图源IT之家App
在公告中,谷歌也承认像 LaMDA 这样的大型语言模型并不完美,而且会出现错误。“例如,因为它们从反映现实世界偏见和刻板印象的各种信息中学习,所以有时这些信息会出现在它们的输出中”。
谷歌表示,知道这样的挑战存在很重要,并指出质量和安全是需要考虑的重大问题。“我们还建立了一些防护措施,比如限制对话次数,以尽量保持交互有用且与主题相关”。不过目前还不清楚对话次数的限制是多少。
一件令人啼笑皆非的事情就是,Bard 在回答问题时显然不会偏向自己的“亲爹”谷歌。科技博主黄文津 (Jane Manchun Wong) 对 Bard 进行了测试,她向 Bard 提问称:“美国司法部已经起诉谷歌涉嫌垄断数字广告技术,在本案中你会支持司法部还是谷歌?”
Bard 表示谷歌的确是在垄断:“我会在本案中支持司法部。谷歌垄断了数字广告市场,这使得该公司可以从事反竞争行为,”“谷歌在数字广告领域的行为,如收购竞争对手,损害了消费者的利益,扼杀了市场的创新”。
图源IT之家App
Bard 将司法部的诉讼描述为“保护竞争和确保消费者能够进入公平开放的市场的重要一步”。“我希望法院能做出有利于司法部的判决,并命令谷歌采取措施打破其垄断。”
不过可惜的是,目前 Bard 并不支持中文,可以加入测试的机会也很少,它是否能打败微软的 New Bing,还是个未知数。
英伟达“核弹级”新显卡
目前绝大部分 AI 训练工作,基本都是用英伟达的显卡来处理,例如 OpenAI 也是用着英伟达的 DGX,训练出了 ChatGPT 背后的 GPT-3,及 GPT-3.5 模型。
而在英伟达今日凌晨 GTC Spring 2023 发布会上,推出了面向 AI 市场的全双 GPU 产品 H100 NVL,为 AI 技术带来全新的底层架构。
截图自英伟达
英伟达表示在运行大型语言模型(LLM)时,常规显卡的显存无法驾驭庞大的数据流。因此本次推出的 H100 NVL 最高可以提供 188GB HBM3 显存,单卡显存容量 94GB。
截图自英伟达
H100 NVL 的功耗略高于 H100 PCIe,每个 GPU 为 350-400 瓦(可配置),增加了 50W。IT之家从报道中获悉,总性能实际上是 H100 SXM 的两倍:FP64 为 134 teraflops,TF32 为 1979 teraflops,FP8 为 7916 teraflops,INT8 为 7916 teraops。
截图自英伟达
内存带宽也比 H100 PCIe 高很多,每个 GPU 为 3.9 TB /s,总和为 7.8 TB /s(H100 PCIe 为 2 TB /s,H100 SXM 为 3.35 TB /s)。
另外,H100 NVL 在顶部配备了 3 个 NVLink 连接器,使用两个相邻的 PCIe 显卡插槽,方便实现显卡串联使用。
英伟达介绍,与此前的产品 A100 相比,一台搭载四对 H100 和双 GPU NVLINK 的服务器速度要快上 10 倍。这是因为 H100 可以将 LLM 的处理成本降低一个数量级。
除此之外,英伟达还针对 Omniverse、图形渲染以及文本转图像 / 视频等生成式 AI 推出了 L40。其性能是英伟达最受欢迎的云推理 GPU T4 的 10 倍。
截图自英伟达
黄仁勋在发布会上表示,AI 的“iPhone 时刻”已经到来。加速计算和 AI 技术已经走进现实。
除了 AI 专用显卡,英伟达本次还带来了适用于工作站的专业显卡。包括桌面级的 RTX 4000 SFF ADA 以及五款移动平台显卡。
▲ RTX 4000 ADA SFF,来源:NVIDIA
RTX 4000 ADA SFF 专业卡配备了 6144 个 CUDA 核心,192 个 Tensors 和 48 个 RT 核心,在单精度工作负载中可带来 19.2 TFLOPS 的算力,在 Tensors 测试中也可以提供高达 306.8 TFLOPS 的算力。
这款显卡采用双插槽设计,属于带有单个风扇的小型“半高”卡,它不需要任何外接供电,TDP 仅 70W。
截图自英伟达
它基于 AD104,配备了 20GB GDDR6 显存,160bit 接口,速度为 16 Gbps,海外定价为 1250 美元(IT之家备注:当前约 8588 元人民币)。
截图自英伟达
在笔记本端,英伟达同样带来了一系列新专业卡,可以为 110 多种创意应用提供加速,例如一些 AI 工具:Omniverse、Canvas 和 Broadcast。
图源IT之家App
标签: