中国搜索联盟 什么是中国搜索联盟

这是编辑输入“钛媒体”三字,chatGPT给出的答案,准确度确实令人惊艳。

接受钛媒体App独家采访时,京东集团副总裁、IEEE Fellow何晓冬博士表示,中国应该要发展自己的ChatGPT模型产品。

“坦白讲,(语音机器人)这个方向是对的,以后会有这个市场需求。”何晓冬强调,除了在研究方面继续向前探索外,在文本生成上,ChatGPT有独到的体验和价值,已经快要接近可商用的地步了。

ChatGPT到底是怎么形成的?能否取代搜索引擎?

“AI 快要成精了!”有投资人玩ChatGPT之后在朋友圈这样感慨。

那么,什么是ChatGPT?

你可以理解为,ChatGPT偏任务型的多轮对话或问答系统,定位于“通用型 AI 技术助理”。相比苹果Siri 和小爱同学的“订餐、订票、订宾馆”,ChatGPT更多执行开放域任务,即问答、阅读理解、推理、头脑风暴、写作文、改错等,可以说是“AI 版的知乎”。

今年3月4日,OpenAI 团队在预印版网站arxiv上提交了一篇题为“训练语言模型以遵循人类反馈的说明”的论文,详细阐述了ChatGPT背后基于拥有13亿个参数的InstructGPT大模型的技术能力。

OpenAI 在论文中指出,ChatGPT核心在于InstructGPT模型输出,更深层次是基于 OpenAI 研发的GPT-3.5基座能力。尽管InstructGPT模型参数,比NLP预训练模型——GPT-3 1750亿个参数少100倍,但前者的数据模型有所甄选、校准和微调,训练出来的结果更精准,能够更简单的优化语言模型。

该团队称,ChatGPT大部分沿用了InstructGPT的训练方式,在数据收集阶段招聘了人类 AI 训练师,同时扮演用户和 AI 助理角色收集数据。在此过程中,这些 AI 训练师可以根据初始模型的结果修改模型生成的回复,从而被用于有监督地精调训练模型。随后,工程师会对模型的多个生成结果进行比较,从中甄选数据中更加符合人类偏好的输出信息,甚至存在持续学习能力。OpenAI 统计发现,其API用户在超过70%的情况下更喜欢InstructGPT。

目前,ChatGPT仍处于免费测试阶段,不限量向公众开放。而基于其破百万的用户数,平台所花费的成本不算小。马斯克曾询问“每次聊天的平均费用是多少”,Altman回复:“用户平均每次聊天所花费的可能是个位数美分。”

钛媒体App也第一时间尝试使用ChatGPT模型,简单问了三个关于芯片相关的问题。我们发现,ChatGPT有些信息非常精准,有点像知乎或百科的回答,有时候像谷歌、Bing的搜索引擎结果。但它的答案精准度依然有待商榷。

1、摩尔定律什么时候会终结?2、英特尔未来能否超越AMD和英伟达?3、帮我写一篇芯片的七言绝句

清华大学计算机科学与技术系长聘副教授、博导,聆心智能创始人黄民烈告诉钛媒体App,ChatGPT展示了新一代 AI 技术的能力,或许不远的未来,一定程度的AGI(通用人工智能)可以做到。至少无缝人机交互是乐观的。他指出,InstructGPT的数据很好,胜在数据质量高、多样性、RLHF算法。其中,强化学习带来的增益非常之大。

目前来看,ChatGPT的升级在于更多是算力与语料调教后的技术成果。

何晓冬则对钛媒体App表示,ChatGPT模型在使用体验上确实让人感觉耳目一新。无论是流畅性,还是逻辑感都非常强,逻辑强于内容。但“干货”量偏低,缺少一些知识的准度,“其实某种意义上,我觉得它的实用价值现在还是比不上谷歌(搜索)的。”

前Google总部科学家、出门问问创始人李志飞接受采访时表示,相对于语音助手和搜索引擎,ChatGPT还有很多不能干或干不好的事情。ChatGPT的“认知”建立在虚拟训练文本上,没有跟实时的数据库或信息连接,仍有些“空中楼阁”的味道,所以特别适合插科打诨。

有用户总结,目前ChatGPT不能回答的话题包括:不能预测可能会但从未发生过的事件及其后果;不能OpenMind或打破常规建立新规则和新模式;不能深入问题的细节去回答而是停留概要层面;无法区分是否为事实问题,一些非事实问题无法得到回答;很偏门的问题(可能从未有人这么想过的问题)不会回答;不能列出非主流观点;对话语境不能跳跃太大,领域跨度太大等。

但专栏作家Parmy Olson却认为,相比谷歌搜索抓取数十亿个网页内容编制索引,然后按照最相关的答案对其进行排名,包含链接列表来让你点击。ChatGPT却直接基于它自己的搜索和信息综合的单一答案,回复流程更加简便。

针对外界认为ChatGPT能否取代搜索引擎的讨论,ChatGPT自己却给出了“否定”回答:ChatGPT并不是搜索引擎。它的目的不是提供信息搜索。相对于搜索引擎通过索引网页并匹配搜索词来提供信息,ChatGPT则是通过对自然语言问题的回答来帮助用户解决问题。因此,它们之间没有直接的竞争关系,并不能相互颠覆。

早前,OpenAI还发布了DALL·E 2——可以通过文本描述中生成图像的 AI 程序。国盛证券指出,相比于此前的AI绘画,ChatGPT更具有将AI能力与工作流程相结合的潜力,如果将ChatGPT与Midjourney等创作工具融合,有可能直接输出设计图稿等内容。而ChatGPT和DALL·E两个产品都是AIGC技术带来的新变革。

“我认为 AI 的潜力还可以进一步放大和挖掘。回看过去这十年,AI 技术的进步确实超出想象。10年前你可以看到图像、语音识别有突破,但肯定不会想到绘画、文章也可以通过 AI 生成逻辑性产品,这两者是不同的。这十年 AI 在不停的超越和突破很多人的预期和想象,这还是挺了不起的。”何晓冬对钛媒体App表示,这次ChatGPT最大的创新点在新的半监督学习算法,使得它对用户的意图理解,可能快达到大规模商用的搜索引擎水平。

何晓冬认为,相较于之前大量使用无监督深度学习算法,ChatGPT模型背后的算法和训练过程更加新颖。如果没有人的数据甄选,这个模型参数即便大十几倍,也很难达到这个效果。尤其ChatGPT把生成的文本模型更加“组织化”,这是非常大的技术创新。

“在某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”何晓冬表示。

OpenAI 于2021年底已经完成了2.5亿美元的A轮融资,投资人包括微软、马斯克、谷歌风投、老虎基金、A16z以及Altman前东家Y-Combinator等。据The Information报道,成立七年的 OpenAI 公司估值已经接近200亿美元,是其2022年预计收入的500-800倍。

在2020年 OpenAI 发布GPT-3之后,微软于当年9月22日取得独家授权。报道指,OpenAI 每年在微软云计算上花费约为7000万美元。

中国应该有自己的ChatGPT

事实上,尽管ChatGPT海外爆红、服务器被挤垮,百万网友使用,但不包括中国境内的实名用户。很多拥有国内 86电话用户无法使用ChatGPT。虽然有很多替代的网站或方案,或直接到非官方渠道购买 OpenAI 网站账号,但仍引发很多用户抱怨,国内用户体验大打折扣。

“中国必须要有自己的基座大模型,应用大模型。很简单,OpenAI 关键模型不开源,只给API,中国还不能随便用,已经是‘卡脖子’了,所以我们为什么不做这样的事情。”黄民烈对钛媒体App表示,包括百度、聆心等国内很多团队正在(对AIGC)做决心与相关资源投入解决相关问题。

告别硅谷崇拜,在中国互联网世界中,国内应该建立有中国创新特色的ChatGPT,甚至是超越OpenAI能力的中国 AI 公司。这已经成为中国 AI 产业发展的必答题。

事实上,2022年也因此被称为“AIGC元年”,生成式 AI 发展迅速。今年9月一篇文章中提到,生成式 AI 可以处理的领域包括了知识工作和创造性工作,涉及数十亿的人工劳动力。生成式AI 可以使这些人工的效率和创造力至少提高10%,有潜力产生数万亿美元的经济价值。

根据中关村大数据产业联盟发布的《中国 AI 数字商业展望2021-2025》报告预计,至2025年,中国 AI 数字商业核心支柱产业链规模将达到1853亿元,未来五年的复合增长率约为57.7%。国泰君安则预测,未来五年,或将有最多30%的图片内容由 AI 技术参与生成,相应有600亿以上的市场规模。

AIGC产业链(来源:行业报告)

在国内,AIGC概念企业正逐步成长,包括奇绩创坛、联想创投、华创资本、唯猎资本等机构都在观望或关注。今年12月,AI生成3D内容的数字品牌AVAR获得天使 轮融资,成立一年间已连续完成三轮;另一家跨越星空也在半年内连续完成两轮共数千万元融资。未来是否存在类似 AI 绘画平台Stable Diffusion背后的Stability AI 的独角兽公司,依然需要时间等待。

何晓冬表示,目前GPT(AIGC)创业价值有两点:一是如果从研究角度看,国内会继续往算法技术创新上探索;二是产业价值,特别在文本生成上有独到的体验和价值,本身已经接近可商用的地步了。未来可能需要考虑具体场景应用以及准确性等,尤其是垂直的专业知识。

“现在确实是 AI 应用发展的好时机,尤其是应用落地的时机。我对 AI 比较乐观,而且我认为 AI 未来肯定要走产业路线。我越来越感觉到产业界应用机会比学术界更大。”何晓冬认为,AI 技术慢慢地会从一个“作坊式”研究探索变成“工业级”工程或系统落地。目前,何晓冬团队正在对 AI 语音交互、多模态智能、数字人等诸多技术产品展开探索与研发落地。

对于有行业人士称,ChatGPT存在输出结果不稳定,商业落地并不容易,还需深耕,而且很难找到工业端应用范围,尤其它需要大量算力。

黄民烈向钛媒体App回应称,ChatGPT定位为通用任务型助理,作为工具,容易被很多人用到。当然这里面商业成本是必须要考虑的,但他认为未来一定是成本下行的趋势,一定会产生很多商业应用。可以参考现在很多文生图的公司和应用、感知和认知领域的 AIGC等。“所以我绝对是积极乐观的。”

此外,AIGC带来的法律版权、种族和性别偏见、伦理等问题不可忽视。据Axios报道,Adobe正在考虑将 AI 生成的图片以付费形式售卖,消息一出引起广泛讨论。

大成律师事务所肖飒法律团队在公众号发文指出,一般情况下 AI 创作并不会发生侵权行为,但如果 AI 在创作某一幅具体的画作的过程中使用了过多某作品中的元素,或者是作为模板的作品本身属于侵权作品,那么该 AI 生成的画作就可能被认定为侵权作品,从而存在侵权的可能性。“必须明确的是,AI 虽然能够学习,但本身并不懂法律,更不懂得侵权的概念,任凭其自由发展是完全不可取的。”

据财新,小冰公司CEO李笛表示,大家现在的热情很容易被点燃,是因为ChatGPT的对话质量超出预期,但真实商业化不像投资人想得那么简单,ChatGPT的工业应用还有很长的路要走。(本文首发钛媒体App,作者|林志佳)

本站部分内容由互联网用户自发贡献,该文观点仅代表作者本人,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。

(0)

相关推荐

  • 胡来的故事

    再遂平县长大的人,基本上都知道一句类似歇后语的话:遂平县的县官—胡来。意思是一个人做事不讲理,不讲法,有点胡作非为的意思。 这句话来源于河南豫剧《李天宝吊孝》。里面一个贪财的县官就叫胡来。故事梗概:明末清初,河南遂平县一富户张忠实为高攀大富李家,把大女儿凤姐许配给李家公子李天保。几年后,李家父母双亡,家业被焚,张忠实有意赖婚,谎称凤姐暴病身亡。李…

    投稿 2023-05-23
  • 澳大利亚奶粉(澳大利亚奶粉价格)

    今年上半年**“奶粉荒”事件闹得沸沸扬扬,让各国的奶粉生产商都跃跃欲试,希望能够借此机会进入限制严格的**市场。而在这一全球性的行业竞赛中,澳大利亚的企业似乎赢得一些先机。 这场奶粉风暴始于今年2月,**奶粉巨头雅培公司因产品安全问题召回数款婴儿配方奶粉,此后当地的奶粉供应链就逐渐崩溃。到了5月下旬,**全国配方奶粉缺货率一度攀升至73%以上。 **政府应对…

    2023-05-31 投稿
  • 如何删除页眉页脚,word里面删除的内容怎么删除

    word编辑过程中总会遇到形形色色的问题——多了数不尽的空格和空格、删不掉的横线、空白页面和错误标记。今天小编要专门写一个史上最全的Word删除技巧,这波技巧福利,要稳稳接住啊。 1、 删除空白页Word有时候总会多了一页“空白”页,什么内容都没有,却删都删不掉!诡异的很! 点击【视图】-【大纲视图】; 在独立的圆圈后按两下键盘中的【Backspace】; …

    2023-06-23 投稿
  • 有什么卡流量多(有什么卡流量多的)

    无论是以前、现在,市面上的移动流量卡、电信流量卡(除了联通流量卡),都经常出现各方面的问题,导致不能使用。解决这个问题的一个方法,应该就是用带大流量套餐的正规的电话卡。而且正规电话卡的稳定性不知甩流量卡不知几条街了。资费便宜,既有大流量,亦可打电话,作为副卡也是一个很好的选择。

    2023-05-30 投稿
  • dnf外挂教程(dnf脚本制作教程)

    最近刷了一段时间提灯与地下城这个游戏,太肝了,毛都干没了,于是想制作一个替我刷图的脚本,说干就干,总结下思路。 总思路是 识别当前地图 –> 与地图中可以交互的点交互 —>识别当前地图。 当然这种是比较简单的思路,后期可以拓展。 准备 思路是使用opencv识别人物,道具和怪物等元素,但是考虑到怪物种类不一而足,素材收集也…

    2021-11-21 投稿
  • 品牌库存鞋(品牌库存鞋供应商)

    神秘鞋王”家族 华利集团实际控股人来自张聪渊家族,其家族成员包括张聪渊、周美月、张志邦、张文馨、张育维五人,其中张聪渊、周美月是夫妻关系,张志邦、张文馨、张育维分别为张聪渊、周美月二人的长子、长女、次子。 华利集团上市前股权架构 按照招股书披露,张聪渊、周美月均为中国**籍;张志邦、张文馨、张育维均为中国**籍及加拿大籍。 现年74岁的张聪渊被业界称为“神秘…

    2021-11-28
  • 南京必买的十大特产,南京6大风味名菜

    南京6大风味名菜,历史气息厚重,口味特色醇鲜,吃过之人都说好 2:南京盐水鸭 既然刚才提及了鸭血粉丝汤,那么这款盐水鸭就不能不提了,毕竟它的名气其实仅次于北京烤鸭,而且在历史方面更是有着2500年的历史;它在金陵菜系中也称桂花鸭,以鸭肉的白嫩肥美,鲜香味浓著称,作为凉菜肉食中的典范,你也可以上网买些尝尝哦。 3:清炖鸡孚 这款美食采用小鸡仔作为烹饪主料,汤体…

    2023-02-12 投稿
  • 如何申请吧主(没有吧主的贴吧怎么申请吧主)

    有时候申请贴吧吧主真的要看缘分,不是你在贴吧**有多高,或者你在贴吧吧龄有多大,发了多少帖子,或者你有没有购买会员。这些条件并不能给你成功申请吧主的特权和绿色通道,所以不要在这些方面浪费时间。 前几天,老师心血来潮,用吧龄不到一年几乎0级零发贴量的账号提交了某个贴吧吧主申请。然后在早上提交申请,不到两个小时就给通过了,这可能就是运气吧。也可以说是缘分,只是想…

    2021-12-01
  • 拼多多幕后老板是谁(拼多多幕后大老板是谁)

    拼多多创始人黄峥宣布辞去公司董事长职务,未来将投身食品科学和生命科学领域的基础研究。从马云、刘强东再到黄峥,仅仅1年半时间,国内互联网已经有3位创始人“大佬”先后宣布辞职,而且年龄越来越轻,刚刚宣布辞职的黄峥,还只是一位80后。 按照拼多多刚刚公布的财报,去年年底,拼多多的活跃用户总数接近8亿人,超过阿里和亚马逊,如果仅以用户数量来看,拼多多已经可以算得上全…

    2021-12-15
  • 惠普电脑重装系统,惠普elitebook系列怎么样

    最近一直想买一台移动工作站,某宝一搜动辄上万,小编的钱包扁扁…….不说了 就在前天逛某宝无意间看到8570的准系统(核显),心里的小九九又雀跃了,反正玩游戏也不用笔记本,1000块,没有犹豫立马下单 顺带着拍了I7-3720QM。内存和硬盘家里都有可以剩下一笔钱 进主题 拿到本子第一个感觉就是:重,真TM重,跟我媳妇的Alienwar…

    2023-07-02 投稿
  • 淘宝网首页进不去,淘宝进不去店铺首页

    《淘宝网首页进不去的原因及解决办法》 在如今的网络时代,淘宝网作为国内最大的电商平台之一,承载着无数消费者的购物需求和商家的销售渠道。 然而,有时候我们可能会遇到淘宝网首页进不去的情况,这给我们的购物体验带来了很大的不便。 那么,究竟是什么原因导致淘宝网首页进不去呢?又该如何解决这个问题呢?接下来,我们就一起来探讨一下。 一、网络问题 也许是我们的网络连接出…

    投稿 2025-04-23
  • 期中考试时间一般几月(期末考试时间一般几月)

    文/小玉说教育 考试是检验各位学生学习成果,对知识掌握是否扎实的直接方式,在十多年的学习过程中,各位学生要经历大大小小无数次的考试。 对于学生阶段的学生来说,考试应该是很熟悉的了,从小学阶段开始,在每学期的学习中,都有2次固定不变的考试,一次是期中,一次是期末,随着所读年级的不断变高,考试的次数也会在此基础上不断增加。 洛阳初一和初二期中考试的时间由各区的教…

    2023-02-13