信息是用来消除随机不确定性的东西(信息是用来消除随机不确定性的东西举例)

熵、信息量、信息熵、交叉熵-个人小结

一、理解熵

1、首先看到这个词会产疑问,熵是什么?谁定义的?用来干什么的?为什么机器学习会用到熵?有了这些疑问后慢慢的开始探索~复制代码

熵,热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量。 克劳修斯(T.Clausius) 于1854年提出熵(entropie)的概念, 我国物理学家胡刚复教授于1923年根据热温商之意首次把entropie译为“熵”。A.Einstein曾把熵理论在科学中的地位概述为“熵理论对于整个科学来说是第一法则”。

为了理解熵,必须讲一点物理学。

19世纪,物理学家开始认识到,世界的动力是能量,并且提出”能量守恒定律”,即能量的总和是不变的。但是,有一个现象让他们很困惑。

熵、信息量、信息熵、交叉熵-个人小结

(上图中,单摆在两侧的最高点,势能最大,动能为零;在中间的低点,动能最大,势能为零,能量始终守恒。)物理学家发现,能量无法百分百地转换。比如,蒸汽机使用的是热能,将其转换为推动机器的机械能。这个过程中,总是有一些热能损耗掉,无法完全转变为机械能。

熵、信息量、信息熵、交叉熵-个人小结

(上图中,能量 E 的转换,总是会导致能量损耗 ?E。)

一开始,物理学家以为是技术水平不高导致的,但后来发现,技术再进步,也无法将能量损耗降到零。他们就将那些在能量转换过程中浪费掉的、无法再利用的能量称为熵。

后来,这个概念被总结成了”热力学第二定律”:能量转换总是会产生熵,如果是封闭系统,所有能量最终都会变成熵。

熵既然是能量,为什么无法利用?它又是怎么产生的?为什么所有能量最后都会变成熵?复制代码

物理学家有很多种解释,有一种我觉得最容易懂:能量转换的时候,大部分能量会转换成预先设定的状态,比如热能变成机械能、电能变成光能。但是,就像细胞突变那样,还有一部分能量会生成新的状态。这部分能量就是熵,由于状态不同,所以很难利用,除非外部注入新的能量,专门处理熵。

熵、信息量、信息熵、交叉熵-个人小结

(上图,能量转换过程中,创造出许多新状态。)

总之,能量转换会创造出新的状态,熵就是进入这些状态的能量。

现在请大家思考:状态多意味着什么?复制代码

状态多,就是可能性多,表示比较混乱;状态少,就是可能性少,相对来说就比较有秩序。因此,上面结论的另一种表达是:能量转换会让系统的混乱度增加,熵就是系统的混乱度。

熵、信息量、信息熵、交叉熵-个人小结

(上图中,熵低则混乱度低,熵高则混乱度高。)

转换的能量越大,创造出来的新状态就会越多,因此高能量系统不如低能量系统稳定,因为前者的熵较大。而且,凡是运动的系统都会有能量转换,热力学第二定律就是在说,所有封闭系统最终都会趋向混乱度最大的状态,除非外部注入能量。

熵、信息量、信息熵、交叉熵-个人小结

(上图中,冰块是分子的有序排列,吸收能量后,变成液体水,分子排列变得无序。)熵让我理解了一件事,如果不施加外力影响,事物永远向着更混乱的状态发展。比如,房间如果没人打扫,只会越来越乱,不可能越来越干净。复制代码
熵、信息量、信息熵、交叉熵-个人小结

(上图中,如果不花费能量打扫,房间总是越来越乱。)

熵的解释是混乱度的度量单位,一个系统的混乱度越高它的熵就越高复制代码

二、理解信息量

我们知道了熵的概念最早起源于物理学,用于度量一个热力学系统的无序程度。在信息论里面,熵是对不确定性的测量。

这里有又产生了疑问,熵怎么就合信息论产生了关系?复制代码

信息是我们一直在谈论的东西,但信息这个概念本身依然比较抽象。在百度百科中的定义:信息,泛指人类社会传播的一切内容,指音讯、消息、通信系统传输和处理的对象。

1、信息量和事件发生的概率相关,事件发生的概率越低,传递的信息量越大;2、信息量应当是非负的,必然发生的事件的信息量为零;3、两个事件的信息量可以相加,并且两个独立事件的联合信息量应该是他们各自信息量的和;复制代码

用数学表达如下:

熵、信息量、信息熵、交叉熵-个人小结

三、理解信息熵

但信息可不可以被量化,怎样量化?答案当然是有的,那就是“信息熵”。早在1948年,香农(Shannon)在他著名的《通信的数学原理》论文中指出:“信息是用来消除随机不确定性的东西”,并提出了“信息熵”的概念(借用了热力学中熵的概念),来解决信息的度量问题。

好了,这里就产生了信息熵!那么怎么解释呢?那信息熵如何计算呢?复制代码

举个吴军在《数学之美》中一样的例子,假设世界杯决赛圈32强已经产生,那么随机变量“2018年俄罗斯世界杯足球赛32强中,谁是世界杯冠军?”的信息量是多少呢?

根据香农(Shannon)给出的信息熵公式,对于任意一个随机变量X,它的信息熵定义如下,单位为比特(bit):

熵、信息量、信息熵、交叉熵-个人小结

把最前面的负号放到最后,便成了:

熵、信息量、信息熵、交叉熵-个人小结

上面两个熵的公式,无论用哪个都行,而且两者等价,一个意思。复制代码

那么上述随机变量(谁获得冠军)的信息量是:

熵、信息量、信息熵、交叉熵-个人小结

其中,p1,p2,…,p32分别是这32强球队夺冠的概率。 吴军的书中给出了几个结论:一是32强球队夺冠概率相同时,H=5;二是夺冠概率不同时,H<5;三是H不可能大于5。 对于第一个结论:结果是很显然的,夺冠概率相同,即每个球队夺冠概率都是1/32,所以H=-((1/32)·log(1/32)+(1/32)·log(1/32)+…+(1/32)·log(1/32))=-log(1/32)=log(32)=5(bit)

对于第二个结论和第三个结论:使用拉格朗日乘子法进行证明,详见《求约束条件下极值的拉格朗日乘子法》。这实际上是说系统中各种随机性的概率越均等,信息熵越大,反之越小。

从香农给出的数学公式上可以看出,信息熵其实是一个随机变量信息量的数学期望。复制代码

日常生活中,我们经常说某人说话言简意赅,信息量却很大,某些人口若悬河,但是废话连篇,没啥信息量;这个电视剧情节太拖沓,一集都快演完了也没演啥内容。这里的信息量/内容与信息熵有什么关系呢?

很多人把这些东西与信息熵混为一谈,得出“说话信息量越大,信息熵越高”“语言越言简意赅,信息熵越高;语言越冗余堆积,信息熵越低。”等等结论。

不是说这些说法错了,而是容易引起误导。个人认为,这里日常语境的信息量与其说是信息量,不如说是信息质量和信息传递效率问题,有没有干货,有没有观点,有没有思想,并且在一定的文字长度/播放时间内,能不能有效的表达出来,这个其实是人的能力问题,和信息熵没啥关系好不!

四、联合熵、条件熵、交叉熵

联合熵:两个随机变量X,Y的联合分布,可以形成联合熵Joint Entropy,用H(X,Y)表示。条件熵:在随机变量X发生的前提下,随机变量Y发生所新带来的熵定义为Y的条件熵,用H(Y|X)表示,用来衡量在已知随机变量X的条件下随机变量Y的不确定性。复制代码

且有此式子成立:H(Y|X) =H(X,Y) – H(X),整个式子表示(X,Y)发生所包含的熵减去X单独发生包含的熵。至于怎么得来的请看推导:

熵、信息量、信息熵、交叉熵-个人小结

熵、信息量、信息熵、交叉熵-个人小结

简单解释下上面的推导过程。整个式子共6行,其中第二行推到第三行的依据是边缘分布p(x)等于联合分布p(x,y)的和;第三行推到第四行的依据是把公因子logp(x)乘进去,然后把x,y写在一起;第四行推到第五行的依据是:因为两个sigma都有p(x,y),故提取公因子p(x,y)放到外边,然后把里边的-(logp(x,y)-logp(x))写成- log(p(x,y)/p(x)) ;第五行推到第六行的依据是:条件概率的定义p(x,y) = p(x) * p(y|x),故p(x,y) / p(x) = p(y|x)。复制代码

相对熵:又称互熵,交叉熵,鉴别信息,Kullback熵,Kullback-Leible散度等。设p(x)、q(x)是X中取值的两个概率分布,则p对q的相对熵是:复制代码
熵、信息量、信息熵、交叉熵-个人小结

在一定程度上,相对熵可以度量两个随机变量的“距离”,且有D(p||q) ≠D(q||p)。另外,值得一提的是,D(p||q)是必然大于等于0的。附录:联合熵、条件熵、交叉熵、互信息

#交叉熵例子

熵、信息量、信息熵、交叉熵-个人小结

这是公式定义,x、y都是表示概率分布(注:也有很多文章喜欢用p、q来表示),这个东西能干嘛呢?假设x是正确的概率分布,而y是我们预测出来的概率分布,这个公式算出来的结果,表示y与正确答案x之间的错误程度(即:y错得有多离谱),结果值越小,表示y越准确,与x越接近。

比如:

x的概率分布为:{1/4 ,1/4,1/4,1/4},现在我们通过机器学习,预测出来二组值:

y1的概率分布为 {1/4 , 1/2 , 1/8 , 1/8}

y2的概率分布为 {1/4 , 1/4 , 1/8 , 3/8}

从直觉上看,y2分布中,前2项都100%预测对了,而y1只有第1项100%对,所以y2感觉更准确,看看公式算下来,是不是符合直觉:

熵、信息量、信息熵、交叉熵-个人小结

熵、信息量、信息熵、交叉熵-个人小结

对比结果,H(x,y1)算出来的值为9/4,而H(x,y2)的值略小于9/4,根据刚才的解释,交叉熵越小,表示这二个分布越接近,所以机器学习中,经常拿交叉熵来做为损失函数(loss function)。参考文献:K码农-http://kmanong.top/kmn/qxw/form/home?top_cate=28

本站部分内容由互联网用户自发贡献,该文观点仅代表作者本人,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。

(0)

相关推荐

  • 净利率计算公式是什么(净资产收益率计算公式是什么)

    一、净资产收益率的计算公式 其计算公式为: 净资产收益率=净利润/平均净资产×100% 其中,平均净资产=(年初净资产+年末净资产)/2 该公式的分母是“平均净资产”,也可以使用“年末净资产”。如公开发行股票公司的净资产收益率可按下面公式计算: 净资产收益率=净利润/年度末股东权益×100% 杜邦公式: 净资产收益率(ROE)=净利润/净资产=销售净利润率×…

    知识百科 2021-12-11
  • 红黄蓝教育让孩子更聪明更有活力

    文/小欢欢爸爸 根据相关数据表示:男孩小时候大多数都偏爱黑色和蓝色,而女孩都是粉色、红色,其次就是蓝色和橙色。 但随着年龄的增大,每个人都对于颜色的喜爱也会发生变化,而在这些变化里面其实就透露着孩子的内心。 色彩猜测心理学专家吕舍尔认为:通过观察孩子对不同色彩的偏爱程度,可以用来窥探他们的内心。 孩子对颜色感知的发育史 在怀孕16周的时候,胎儿就已经能够感受…

    知识百科 2023-06-03
  • 加盟小吃店排行榜暴利(加盟店最火爆的项目)

    世间美食千千万,特色小吃最喜欢。小吃这个品类深受年轻人的喜爱,具有巨大的市场潜力。 小吃店经营涉及到口味、卫生、选址、经营等各个方面,任何问题都可能导致炸鸡店的经营失败。所以新手开店最好选择熊家炸鸡这样有市场经验的品牌,品牌总部会因地制宜的根据当地的情况制订一套最佳的开店方案计划。那么,莱得快有什么优势呢? 莱得快酸辣粉官网_重庆小吃加盟_重庆地标美食加盟_…

    2023-02-14
  • 大学生创业者的创业动机类型包括

    2020《超星尔雅》创业基础答案大全: 课程概况 1、 普通本科学校创业教育的示范教材《创业基础》的作者是()。D A、王兴义 B、郑开显 C、李一夫 D、李家华 2、 以下叙述中正确的是()。D A、创业基础课程是一门发散性比较强的课程。 B、创业基础课程的很多概念、理论还未形成一致的结论。 C、创业基础课程体系已经发展得十分完备。 D、创业基础课程具有较…

    知识百科 2023-04-10
  • 物联流量上网卡(上网卡纯流量物联卡申请)

    如何申请办理物联网卡?可否免费申领物联网卡?物联网是根据通讯技术保持物与物中间的信息交互,超过智能化系统运用,而作为物物相接的公路桥梁,物联网卡当然遭受了广泛关心,物联网卡是运营商为公司机器设备连接网络所发布的一种上网卡,仅有信息连接网络作用,不可以打电话和短消息,那么物联网卡如何申请办理呢,可以申请免费的物联网卡吗? 新讯物联表明,我们在办理物联网卡前是可…

    2023-05-25
  • 海上钢琴师剧情 ,海上钢琴师的深度意义

    海上钢琴师 可是随着伯特曼的离去,1900就开始了自己命运多舛的一生,因为人只要有父母,有故乡,有亲朋好友,那么无论我们遇到多大的挫折,我们都有倾诉的对象,有发泄的媒介,有承接我们的委屈和痛苦的东西,可是1900却没有,或者说是8岁以后就没有了,因为8岁以前他虽然没有父母,但是伯特曼至少算是他的养父,童年的生活还算开心快乐,但是养父一走,他彻底变成孤家寡人了…

    2023-06-06 知识百科
  • 家具微信朋友圈广告大全(家具宣传朋友圈)

    成都日报·锦观新闻 记者 刘浏 广告随意使用绝对化用语,自称“最大”,违反了广告法。金堂县一家具城在车身广告自称“最大”,今年1月14日被处罚4.1万元。 案由:三轮车广告语自称“最大” 2021年10月25日,金堂县市场监督管理局执法人员根据群众举报,对金堂县某家具城经营场所进行现场检查,发现其经营场所内停放有三轮摩托车一辆,车身上贴有含有“**家居 金堂…

    2023-03-31
  • 泰拉瑞亚套装排行,泰拉瑞亚手游必合武器推荐

    泰拉瑞亚手游必合武器推荐,还有套装。泰拉瑞亚虽然有丰富的武器道具和套装等等,但是还是有一些装备是非常推荐的,虽然玩家们可以按照自己的喜好去任意搭配武器和道具等等,但是假如在冒险的过程中遇到了一些挫折,比方说卡boss(怎么样也打不过某个boss),或者说在某个地图里推进得非常困难,不妨来看一下主流的装备套装攻略吧。 而它的掉落在是由火星人入侵事件触发的,玩家…

    2023-02-13 知识百科
  • 希音跨境电商官网?中国服装产业链哪里最完备

    中国服装产业链哪里最完备,莫属珠三角!布匹有中大布匹市场、海印布料总汇、光复南布料市场和天雄纺织城等,现已成为了珠三角乃至国内市场的”领头羊”。成衣批发市场有沙河、十三行、广州火车站商圈,不管是内贸还是外贸都做得相当出色。 希音的创始人许仰天本是山东人,学的也是计算机,但是他是中国首批接触到跨境电商这个行业的,那时候,阿里巴巴也刚刚起…

    2023-02-07
  • 益节保洁机器人,益节保洁机器人:家庭清洁更轻松,更省时

    通讯员:葛宇锋 浙江机电职业技术学院智能制造学院的学生团队,研发出了一款全新的爬楼扫地机器人,解决保洁人员在高层清洁工作问题。 该项目团队于一年前组建,由一群来自不同专业、年龄的年轻人组成。经过数月的研发和测试,他们先后经历了许多困难和挑战。该机器人由机身、电机、传感器、控制器等部分组成,性能非常优异,能够实现自主规划清洁路线、避障、自动充电等功能。在整个发…

    知识百科 2023-05-18
  • a3图幅的标准尺寸是多少(a3图幅的标准尺寸是多少)

    机械绘图中,设计师会严格按照机械绘图标准来画图。一张完美的图纸,是不可能没有图框的。而先画图纸还是先画图框成了很多设计师争论的对象。应机械绘图标准要求,同时使用中望CAD机械版的图幅功能,能更好的规范图纸信息,如图层、比例等。传统的平台绘图中,我们需要利用矩形、偏移、直线等命令绘制我们想要的图框,来来来,跟我一起回忆一下! 第二步:指定原点,画一个长为420…

    知识百科 2023-04-07
  • 旅游小镇规划设计(韶山温泉旅游小镇规划图)

    旅游特色小镇是指依托具有开发价值的旅游资源,提供旅游服务与产品,以旅游业、休闲产业为支撑,具有较大比例旅游人口的小城镇,是景区、休闲聚集区、城镇建设区三区合一的综合架构。旅游特色小镇亦是承担产业定位、文化内涵、旅游功能、社区特征的空间载体,也是未来中国城镇发展的重点。 旅游特色小镇评定首先应具备以下三个基本条件: 1.至少具备一个3A级以上旅游区的资源当量和…

    2023-05-25