【资料图】
编程客栈()4月28日 消息:Facebook 母公司 Meta 的人工智能研究人员推出了一种新的语言模型TbbBpJbrdFoolformer,旨在处理自然语言处理用例中多个 API的调用。
Toolformer 基于 GPT-J,后者是一种67亿参数的开源语言模型。Meta 的研究人员为该模型配备了一系列工具,它可以自主使用这些工具来完成任务,例如预测文本或回答数学问题。
Toolformer 可以访问的工具包括一个计算器、一个问答系统、两个不同的搜索引擎、一个机器翻译系统和一个日历。
其中,使用的机器翻译系统是其编程客栈NLLB模型的6亿参数版本,适用于200种语言。Toolformer 使用日历 API,在查询时无需任何输入即可返回当前日期。回答问题系统使用的是 Meta 的Atlas模型。
值得注意的是,其搜索引擎之一是维基百科搜索,它会在出现提示时返回js来自维基百科的短文本片段。
上面的示例展示了 Toolformer 的功能。该模型自主决定调用不同的 API 来获取对完成一段文本有用的信息。Meta论文中的这个例子看到该模型利用了一个问答系统、一个计算器、一个机器翻译系统和一个维基百科搜索引擎。
尽管底层模型基于 GPT-2模型,但 Meta 发现 Toolformer 在少数零样本 NLP 任务上可以胜过 GPT-3模型。虽然 GPT-3在问答方面表现更好,但 Toolformer 在大多数其他测试中击败了 OpenAI 模型,包括数学推理和机器翻译。
Toolformer 类似于 OpenAI 的ChatGPT,用户输入自然语言提示,系统生成响应。Toolformer 的不同之处在于,它的各种工具可用于通过搜索引擎功能等工具根据最近发生的事件生成响应。ChatGPT 和其他php人是使用的是截止某个时间点数据集构建的,这意味着它们无法响应用户对最近事件的查询。
Meta 的研究人员在他们的论文中承认,Toolformer 比其同时代的 ChatGPT 更不完整,其目前在使用上仍存在局限性”。
关于Toolformer论文介绍网址:https://arxiv.org/abs/2302.04761
标签:
发展好银发经济,既能提高老年人生活和生命质量,也是促进经济发展、增
9月5日一大早,方山县马坊镇四皓村安全管理员孙金全就开始了一天的工作
00:539月6日,走失了12年的小董终于在陕西华阴老家和父母团聚。2011年
9月8日,中国政府网刊发了交通运输部对网民关于“敬老交通卡能否全国统
9月8日上午杭州第19届亚运会火炬传递在杭州西湖涌金公园广场启动火炬手
1、1:四人寝;2:卫生条件可以,比较干净;当然自己也得爱卫生,不管
9月8日长白山召开中报业绩说明会,2023上半年公司实现营收1 68亿元,同
北京时间9月8日,沙特媒体消息,在引入费利佩后,吉达联合将今夏花费月
9月4日至6日,2023中国国际化工展览会(ICIFChina)在上海举行,延长石
中国商务新闻网是商务部国际商报社主办,国家互联网信息办公室批准的国
2023年9月8日晶升股份(688478)发布公告称东吴证券(601555)、招商基金
刚满10天的婴儿患病紧急就医途中被困高速隧道危急时刻安康高速交警迅速
美媒LeBronFactory发文道:勒布朗即将开启他在湖人生涯的第六个赛季;
大河网讯近日,农业农村部农产品质量安全中心发布《2023年第二批全国名
中新网9月7日电综合报道,继英国3月宣布向乌克兰提供贫铀弹后,美国五
一、区分邻接权和著作权的关键特征有哪些著作权和著作邻接权的区别:1
今年以来,龙门县纪委监委念好“敲、护、强、树”四字诀,运用党内谈话
南方财经9月1日电,傲农生物在互动平台回复称,因近期原料价格上涨,公
1、诞生背景:SEDEX是一家总部设在英国伦敦的非赢利组织,世界上任何地
8月31日,有网友反映,洛阳市东方人民医院(河南科技大学第三附属医院
X 关闭
X 关闭