Anthropic 推出改进版入门级LLM AI模型

2023-08-10 09:56:38    来源:cnBeta


【资料图】

由前开放人工智能公司(OpenAI)高管共同创立的人工智能初创公司 Anthropic 发布了其更快、更便宜、可通过 API 生成文本的模型 Claude Instant 的升级版本。

据 Anthropic 称,更新版 Claude Instant(Claude Instant 1.2)吸收了 Anthropic 最近发布的旗舰模型 Claude 2 的优点,在数学、编码、推理和安全性等方面都有"显著"提高。在内部测试中,Claude Instant 1.2 的编码基准得分率为 58.7%,而 Claude Instant 1.1 的得分率为 52.8%;在一组数学问题中,Claude Instant 1.2 的得分率为 86.7%,而 Claude Instant 1.1 的得分率为 80.9%。

Anthropic 在一篇博文中写道:"Claude Instant 生成的回答更详尽、更有条理,而且能更好地遵循格式说明。Instant1.2在引用提取、多语言功能和问题解答方面也有改进"。

Anthropic 声称,Claude Instant 1.2 并不容易出现胡言乱语的"幻觉"状态,对刻意设定的"越狱"提示也有相当的抵抗能力,在Claude这样的大型语言模型中,"幻觉"是指模型生成的文本不正确或无意义,而越狱则是一种利用巧妙编写的提示绕过大型语言模型创建者为其设置的安全功能的技术。

Claude Instant 1.2 的上下文窗口大小与 Claude 2 相同--100000 个令牌。上下文窗口指的是模型在生成额外文本之前所考虑的文本,而标记则代表原始文本(例如,"fantastic"(奇妙)一词会被拆分成"fan"(粉丝)、"tas"(塔斯)和"tic"(抽搐)等标记)。Claude Instant 1.2 和 Claude 2 可以分析大约 75000 个单词,大约相当于《了不起的盖茨比》的长度。

一般来说,具有较大上下文窗口的模型不太可能"遗忘"最近的对话内容。

正如我们之前所报道的,Anthropic 公司的目标是创建一种"用于人工智能自学的下一代算法",这是它在给投资者的宣传材料中的描述。这种算法可以用来构建虚拟助理,它们可以回复电子邮件、进行研究、生成艺术作品和书籍等等--我们已经通过 GPT-4 和其他大型语言模型尝到了其中的一些甜头。

但 Claude Instant 并不是这种算法。相反,它的目标是与 OpenAI 以及 Cohere 和 AI21 Labs 等初创公司推出的类似入门级产品竞争,这些公司都在开发自己的文本生成(有时是图像生成)人工智能系统,并将其产品化。

迄今为止,由前 OpenAI 研究副总裁达里奥-阿莫迪(Dario Amodei)领导的 Anthropic 公司于 2021 年成立,已融资 14.5 亿美元,估值达到个位数十亿。虽然这听起来似乎很多,但与该公司估计的未来两年创建其设想的聊天机器人所需的 50 亿美元相比,还相差甚远。

Anthropic 声称目前拥有"成千上万"的客户和合作伙伴,其中包括 Quora,该公司通过基于订阅的生成式人工智能应用 Poe 提供对 Claude 和 Claude Instant 的访问权限。Claude为 DuckDuckGo 最近推出的 DuckAssist 工具提供支持,该工具与 OpenAI 的 ChatGPT 结合,可直接回答用户的直接搜索查询。在 Notion,Claude 是 Notion AI 技术后端的一部分,这是一个与 Notion 工作区集成的人工智能写作助手。

关键词:

X 关闭

X 关闭