赚钱机器，如何利用机器学习赚取收入

2023-05-10 11:04:48 • 赚钱案例

对话机器人不是个新技术，以往的机器人产品很多，为什么这次OpenAI公司推出的ChatGPT能这么火？因为以前的机器人只能做简单且有限的事，问天气、放音乐还行，问个复杂一些的事就有点“人工智障”了。ChatGPT可以说技术上的量变引起了效果上的质变，在三个方面让我感觉很惊艳：

有上下文记忆能力，多轮对话衔接得很好，很难看出是机器生成的；有学习纠错能力，在它回答错误之后，如果你纠正了它，第二次就不会再答错；有思维链推理能力，具备一些常识知识，能做复杂一些的算数题。ChatGPT背后的关键技术是什么？

在ChatGPT背后起关键作用的是一种被称为大规模语言模型（Large Language Model，LLM）的东西，ChatGPT用的这款语言模型命名为GPT-3.5，GPT是生成式预训练（Generative Pre-Training）的缩写，目前的版本号是3.5版。此外，在GPT-3.5之上，ChatGPT还通过基于人类反馈的强化学习（Reinforcement Learning from Human Feedback，RLHF），使GPT能够记住之前的对话、承认错误、在连续的多轮对话中给人很顺畅的感觉。大规模语言模型顾名思义，大规模语言模型就是非常大的语言模型。什么是语言模型呢？语言模型简单说来，语言模型的作用就是根据已知句子的一部分，来预测下一个单词或者空缺部分的单词是什么。比如，给你前半句：“国庆前夕，天安门广场前伫立起一个____”，你会预测出空白部分大概率会是“大花篮”。其实，你天天都在用语言模型，当你使用手机或电脑里的输入法回复消息时，它就在推荐你下一个单词。ChatGPT使用的GPT-3.5可比输入法中的语言模型要大很多。输入法语言模型占用的存储空间可能只有50MB，而GPT-3.5有800GB。神经网络GPT为什么会那么大？因为它内部是神经网络的结构。大规模语言模型的基础单元叫做感知机，它模拟了人脑中神经元的结构。这些感知机组织成庞大的网络结构，用来“山寨”人脑的神经网络。一般情况下，一个正常人的大脑约有800~1000亿个神经元，以及约100万亿个突触。神经科学家Paul Maclean提出的三元脑（triune brain)模型，将大脑结构分为三类：爬行脑、哺乳脑、人类脑。爬行脑最早进化出来，负责呼吸、心跳、血压等，完全自动运作。哺乳脑负责情感、记忆、习惯形成等，能够做出非常快的决策。人类脑最晚形成，负责一些复杂的分析推理，是做慢决策，即所有需要深思熟虑的事物。GPT-3.5的参数总量达到1750亿，虽然距离人脑突触的量级还有差距，但也已经显现出之前小规模模型所不具备的推理能力。要想足够智能，网络规模足够大是个必要条件。Transformer大模型的核心是一个叫Transformer的组件，Transformer在这里可不是”变形金刚”的意思，也许翻译成”变压器”意思更接近些。想想我们国家的西电东输工程，西部利用水力、风力、日光所转化的电能，经过变压器压缩成高压甚至特高压，再在电网上传输，到了东部之后再逐级降压，然后才能使用。变压器在其中先升压再降压，有效降低了能量在传输过程中的损耗。我们人类在交流过程中也有类似的过程，同事A跟你说了一件事，你并没有逐字逐句的记在脑子里，而是理解了其中的语义，在脑子里形成一种意识流，这是一种压缩编码的过程。你脑子里保留的意识流具体是什么，你也说不清楚—也不需要说清楚。当你向同事B复述这件事的时候，你重新把它组织成语言，保留了其中的各项重点内容，通过一系列的发音或文字表达给对方，这是解码的过程。这种先编码再解码的过程，就是Transformer的工作原理。另外，在实际当中，有些语言模型只用到堆叠多层的编码器，有些只用到堆叠多层的解码器；堆叠的层数也多有不同，少的有6层、12层，多的有48层。如果你有一些计算机基础，听说过词袋模型（Bag of Words，BOW）、循环神经网络（Recurrent Neural Network，RNN），那么对Transformer就更容易理解了。

BOW完全丢弃了词的位置信息，没有把文本当作有顺序的序列，因此语义理解能力较差。例如，“不，我很好”和“我很不好”，两句话虽然用词一样，但词的位置不同，语义上差别巨大。RNN能较好的保留词的位置信息，可以考虑到词的先后顺序对预测的影响，但是，如果处理的文本长度很长，关键的词之间距离较远时，效果会显著下降。Transformer中引入“注意力”机制，多个组件分别关注句子中不同方面的重点，而且随着网络层次的增加，能够提取出更高级更抽象的语义信息，理解能力更强。Transformer除了语义提取能力强，还能从无标注的数据中学习，而且场景迁移能力好。

思维链此外，大规模语言模型还带给人们的一项意外的惊喜，那就是让人细思极恐的思维链（Chain-of-Thought，CoT）能力。简单地说，思维链就是让LLM将一个问题拆解为多个步骤，最后给出答案，而不是让LLM直接给出答案。直接给答案的出错率更高。比如，你给LLM出了一个题目：“张三养了10条狗，每天照顾每条狗都要花半小时，请问他照顾这些狗要花费多长时间？”LLM直接给答案的话可能会出错，当你提示LLM要“一步步地回答”时，它会告诉你：“张三养了10条狗，每天照顾每条狗都要花半小时，那就是10 x 0.5 = 5小时/天。5小时/天 x 7天/周 = 35小时/周。答案是每周35小时。”这项能力并不是设计者的初衷（初衷只是学习如何说人话），而是在随后的代码训练、提示学习中挖掘出来的，这些能力原本就已经存在于大模型之中，它从代码、书籍、网页中学到了一些常识知识并具备了一定的推理能力。基于人类反馈的强化学习人类问问题的方式对于LLM而言不是最自然的理解方式，为了让ChatGPT给出的答案更贴近人类的问题、更符合公序良俗，它在发布前采取了一种叫做“基于人类反馈的强化学习”（Reinforcement Learning by Human Feedback，RLHF）的训练策略。简单来说，就是花钱找人给模型提出各种可能的问题，并对模型反馈的错误答案进行惩罚、对正确的答案进行奖励，从而实现提升ChatGPT回复质量的目的。光有海量的、无标注的数据还不够，还要有少量的、高质量的标注数据才行。前者用来训练语言模型，让它学会说人话，后者用来训练对话模型，让它别啥都瞎说，比如：回答中不能含有种族歧视和性别歧视的内容，拒绝回答不当问题和知识范围之外的问题。

我能训个ChatGPT吗？

简单地回答：极大概率是不能的。起码在现阶段，这不是招几个人、花些钱就能做成的事，能训出ChatGPT的人可能比做出4纳米芯片的人还要少。这其中的原因是什么？咱先来捋捋ChatGPT超能力的来源，再对比看看自己手中的家底。算力算力，也就是数据的处理能力，与数据、算法，并称为AI三要素。据估计，仅仅训练一次GPT-3，Open AI可是花费了460万美元。对于ChatGPT而言，支撑其算力基础设施至少需要上万颗英伟达A100的GPU，一次模型训练成本超过1200万美元。然而，在这些必要非充分条件中，算力是最容易解决的。数据模型要足够深、足够大，才能解决远距离的语义理解能力、才能产生抽象的推理能力，这些高级的基础的能力具有很好的通用性。因此，高级的能力可能只存在于大型模型中，而训练大模型，需要足够的数据量。全球高质量文本数据的总存量在4.6万亿到17.2万亿个字符之间。这包括了世界上所有的书籍、科学论文、新闻文章、维基百科、公开代码以及网络上经过筛选的达标数据，例如网页、博客和社交媒体。最近的一项研究数据显示，数据总数大约为3.2万亿个字符。DeepMind的Chinchilla模型是在1.4万亿个字符上训练的。也就是说，在这个数量级内，我们很有可能耗尽世界上所有有用的语言训练数据。此外，反观中文网站的数据资源，大致占全世界总资源的1.3%。中文内容相比英文有四五十倍的差距，人工智能脱离不了人类知识的土壤，这方面的先天条件不是短期内花钱或凭一己之力就能解决的。人才ChatGPT公开出来的少量材料中，披露出了一系列训练技巧，比如：代码训练、指令微调、上下文学习等。更多的细节目前还没有公开，即便公开了也不见得是全部，即便全部公开也未必能重现。因为整个过程链条非常长，有大量的工程技巧在里边。俗话说魔鬼藏在细节里，具体的实现和工程技巧才是重头戏，好比刚学做菜的人，即便有足够的食材，照着菜谱也不可能做出一套满汉全席。今年2月初，谷歌已向人工智能初创公司Anthropic投资约3亿美元，并获得该公司10%股份。该公司2021年创立，目前团队规模仅在40人左右，初创期的11位核心成员都曾经参与过GPT-2、GPT-3模型的研发。可见，业界对于人才的重视程度以及人才的稀缺性。

如何用ChatGPT赚钱？

ChatGPT似乎打破了人们关于AI模型的一项固有认知：“通用的不好用，好用的不通用。”大模型革命的一个关键趋势就是，通用大模型比专用小模型表现得更好。对于定位在垂直细分领域里的初创公司来说，既不能自研出大模型，效果上又失去了竞争力，因此是不是就没有活路了？我觉得不是，ChatGPT的能力可以分成chat和GPT两部分来看，即上层的对话和图片的生成能力、底层的语言和推理能力。在ToC类内容消费市场，未来可能会出现大量的、碎片化的AIGC应用，比如生成头像、诗文、甚至短视频等，重点是在有趣的细分场景里发挥创造性和想象力。在消费电子市场里，有对话能力的智能音箱、智能家电在去年的出货量有所下滑，借助更强的对话能力，也许还能挽回一些颓势。在ToB类企业服务市场，AI不再只是替代简单重复性的体力劳动，还将替代简单规律性的脑力劳动，并在逻辑复杂的脑力劳动中辅助员工提升工作效率。简单的脑力劳动，比如营销文案撰写、初级程序员和插画师等。复杂的脑力劳动，可能会围绕具体业务的推理能力，以虚拟工作助手的形式出现。对于处于ToB赛道的科技公司而言，中间层可能会越来越薄，对于行业KnowHow的积累会成为越来越重要的竞争门槛。这其中可能会遇到很多挑战，比如：如何在使用强大的通用模型和构建自己的垂直模型之间进行迭代，如何将通用无标注的大规模数据和领域小规模知识相结合，如何将领域事实知识注入到LLM中使得LLM的输出内容可控。在目前的研究范式下，领域内高质量的标注数据领域推理能力，两者如何形成“飞轮效应”是非常重要的问题。

划重点

说了这么多，总结一下重点，不管你能记住多少，起码下次在电梯里遇到老板或者在饭局上遇到同学时，在聊起ChatGPT的时候，你能插上几句话。

关于大规模语言模型：训练时要用到万亿级的数据、花费百万美元的算力，才能使它能说人话，并具有一定的“思维链”推理能力。大模型的超能力：模型要足够深、足够大，才能产生抽象的推理能力，这些高级的基础能力具有很好的通用性。大模型革命的一个关键趋势就是，通用大模型比专用小模型表现的更好，打破了人们一项固有认知：“通用的不好用，好用的不通用。”应用场景：ToC类应用要找准细分的内容生成场景，ToB类应用要围绕推理能力去发挥，让它成为脑力工作者的辅助，替代一部分简单的脑力工作，辅助员工的做创造性工作。

本文来自投稿，不代表展天博客立场，如若转载，请注明出处：https://www.me900.com/205470.html

赚钱案例

抖音推流地址获取工具抖音推流地址怎么获取

你是否也遇到过辛辛苦苦拍了视频，但结果却还不如跳舞的小姐姐？为什么别人随便拍的视频点赞过万，而自己的视频都没有人看？最近有很多小伙伴留言说自己的短视频老是不给推流量，这是怎么一回事呢？别慌，今天我们一起来了解下抖音短视频的推流机制！首先，抖音作为一个去中心化的平台，可以说是非常的公平，它给了很多宝妈或是上班族逆袭的机会，所以这也是为什么那么多人涌入抖音去…

2023-04-25
赚钱案例

写文章赚钱也是网上赚钱门路

我经常感慨，在网上只要会说会写就能赚钱，这不是空话，随着自媒体爆发以来真正切切的见识到了会说会写是多么的赚钱，看看那些大咖一篇文章件简简单单就能收款几十上百万。话说，写文章赚钱也算是打字赚钱的一种吧，都是属于用键盘码字，但是打字赚钱和写文章又有很明显的区别，打字赚钱只要你会打字即可，而写文章更多的是内容。打字赚钱是人人能做，但是写文章赚钱却不是人人能做，…

2020-02-20
穷人如何挣钱（穷人做哪些生意赚钱）

金钱对于大多数穷人而言，是终生都在为之奋斗、追求的目标。钱钱是生活中不可缺少的特殊商品，没有它几乎是寸步难行。人们为了生存下来，必须想方设法去赚钱来养活自己，养活整个家庭。赚钱成为人们必修的基础学科，只有修好这门技术科学。才有立足立身之地，否则何以立足、立身呢？古谚语：“功夫不负有心人。” 只要肯努力、进取，做事就会获得成功。没有钱…

2022-05-06 • 用户投稿
赚钱案例

天哪!一觉醒来公众号多了3W粉

天哪!一觉醒来公众号多了3W粉收录于话题 #公众号#自媒体大家好，我是小方。正如标题所见，现在咱们的账号有3W+的读者啦。这是因为我把【斗志满满的小方】和【钟言钟言】两个号给合并了，运营者是同一个人哈，是钟言的“钟钟”，也是“小方”。（不知道你们刷到的公众号名字是什么，有没有更新呢）之所以合并，是因为目前我的精力只能运营一个公众号。【钟言钟言】这个号是…

2023-04-24
投稿

带回家做的兼职有什么,可以回家做的兼职分享

日常生活能够见到许多手工作品，例如艺术插花，珠串，绣十字绣，一些针线活，那么这种手工活是否能做兼职把手工带回家去做，能够让家中的老妇女们排成一起说说话做个手工，不亦乐乎。机器日渐风靡的今日，手工的物品变得越来越宝贵。因此做手工也是可以赚钱的哟。在家里带孩子空闲时间比较多，喜爱做手工的宝妈们能够做一些手工挣钱。手工的物品做起來较慢，但是作为一…

2022-04-22
投稿

100个赚钱的方法,100个赚钱的有效方法

十一，空手（怎样）套白狼你要这样做，走到大街上看到一排排的门头店，你进去给他说，你的店面一天客户不是很多，假如我有一个方法能让你每天收入高一倍，高了之后你愿不愿意付给我高出的三分之一？他一定愿意，然后你让他说出现在让他最愁的问题，记下来，你去与他同行的门头店进去逛一逛，你作为一个客户进去问他这些问题，看他是如何回答的，然后去三家，你自己也就能总结出来一个…

2022-04-27
2022年农村最挣钱的门路,在农村的赚钱门路

现在城市里也不好赚钱，很多地方经常封城封区，一遇到这种事，上班族就得居家办公了，甚至还要被隔离14天，而那些开店做生意，更得关门。而在关门期间，铺面租金还是要交的，各种贷款也不能停，时间长了，做生意的人就得倒闭，其实那些上班族也不好受，长期不上班没收入，贷款就会拖垮整个家庭，所以法拍房越来越多了。看到这样的情形，很多人就萌生了想要回农村老家发展的念头，在农…

2022-04-30 • 投稿
创业杂谈

副职业哪个赚钱？副业赚钱的方式

今年副业赚钱，副业刚需这些词非常的火，给我感觉，今年人人都开始搞副业了，为啥？今年环境不太好吧，因为疫情的原因很多人在家里玩了几个月，没有上班就没有收入，一大家子人在家里开销也是非常的大。在这种情况下越来越多的人重视到了副业赚钱的重要性，尽管现在已经全面复工，但是副业的种子已经在心里种下了，慢慢生根发芽。因为主业的关系，所以副业赚钱的时间不会留给我们太多…

2020-11-22
赚钱案例

我的公众号开始盈利了！

我的公众号开始盈利了！大家好，我是小方。之前说过，这个公众号是我的个人碎碎念场所，从来没打算引流。我也确实没在引流上下功夫，到今天为止，一分钱都没花在这上面。哪怕是小红书的主页上，都没有冒险放上公众号名片。幸运的是，每天也在几十几十地涨着粉，虽然不多，但对我来说也是莫大的鼓励，终于体验了一把内容涨粉的快乐哈哈。虽说公众号属于私域流量，不花钱引流很难混出头，…

2023-04-25
赚钱案例

想要薅羊毛，获得最新羊毛信息是关键

每年都会出现很多很多被薅羊毛事件，18年的时候，很多羊毛党薅了一把星巴克，本来回馈用户的优惠券活动因为大波羊毛党来袭，导致营销活动只做了两天就停止了，损失巨大。 19年的时候拼多多一夜之间被薅一个亿，就是4毛充100的那一次，后面淘宝的水果商家还有今年年初的京东羊毛，互联网上羊毛从来都没有断过，从另一面来说，互联网上的羊毛大军真的是非常庞大的一个群体。但都…

2020-04-12
投稿

零成本可以做的副业，轻松超过工资收入

0成本副业，有野心，可以超过打工收入不论线上还是线下，所有的商人一直都是通过帮助用户解决需求牟利，当下信息发展飞速，各种热点各种需求说不准就会在下一个契点爆发。搜索资源、搜索需求一直是人们解决需求的技能，找电影、找音乐、找小说、找学习资料等等各种，然而这些东西90%都是虚拟资源。只要会冲浪的小伙伴都是可以通过特定的渠道，采用付费或者是免费的方式获取资源…

2022-04-29
赚钱案例

我又又又被骂了？

我又又又被骂了？文|钟钟排版|钟钟你好啊，这里是「钟言钟言」我是钟钟。我可能是个冤大头号主。跟我私人关系比较好的读者大概知道，在转型之前，我因为经常被辱骂，好几次想要放弃公众号。之前，我仅仅是以审稿编辑的身份跟大家相处，所以被骂的次数多，也很正常。回复慢了被说是假征稿，投了多篇不过呢，会说我骗稿，是个骗子。当然，比这难听百倍的话，我都听过。刚…

2023-04-26

赚钱机器，如何利用机器学习赚取收入

相关推荐