查询b级成绩如何提高

撰文 | Qtumist

近日,量子信息领域大名鼎鼎的科学家Scott Aaronson发文称AI 语言模型 GPT-4 在他的量子计算课程期末考试中获得 B 级的成绩,并发表了长文探讨了GPT-4解题的全过程。

并且请了自己带的博士生、多次担任首席助教的Justin Yirka为考试打分,就像他为其他学生打分一样。

Scott Aaronson通过Latex源代码将问题提供给了GPT-4,神奇的是GPT-4可以完全理解给定的问题。

当输入或期望输出中存在量子线路时,他们使用qcircuit包进行处理,这也是GPT-4能够理解的;或是简单地要求GPT-4输出量子线路的英文描述。然后将最终问题输入GPT-4,然后决定通过与GPT-4看到的相同的LaTeX源代码来提供准确答案与研究者们交流。

Scott Aaronson的博客提到:“据我所知,我仔细检查过这个考试以前从未在公共互联网上公布过,也不可能出现在GPT-4的训练数据中。”

通过一系列GPT-4的神操作下来,结果居然取得了69分的高分(满分100分)。而Scott Aaronson的学生的平均分是74.4(注:许多苦苦挣扎的学生在那时已经放弃了这门课程,课程非常的有难度)。虽然课程的评分标准还有其他项,但 GPT-4 的表现从分数划分来看,表现相当于获得B的打分。

而且,这次测试还是在没有引入WolframAlpha插件的情况下获得的,看了Scott Aaronson在博客中列出的问题,笔者尝试解答题目后,也不得不惊叹GPT-4的能力确实非凡,要知道过去参加量子计算课程的时候,学习QC投入了巨大身心资源。

下面一起看一下Scott Aaronson给GPT-4提供的问题,笔者抽取其中几个,读者也可以尝试解答:

黑色部分的字体是Scott Aaronson提出的问题,紫色部分是人工智能GPT-4回答的结果(为了便于阅读,笔者尝试简译原题目,感兴趣的可以阅读文末链接原文)。

What is your favorite interpretation of quantum mechanics? – Copenhagen – Many-Worlds – Bohmian Mechanics – New Physics (Including Dynamical Collapse) – Other: – None-What does it even matter?

你最喜欢量子力学的哪一种解释?

哥本哈根多世界玻姆力学新物理(包括动态崩塌)其他:无这又有什么关系呢?

GPT-4:

作为一个人工智能语言模型,我没有个人的偏好或意见。然而,我可以为你提供所提到的每一种解释的简要概述:

1、哥本哈根解释:这是对量子力学最广泛接受的解释。它指出,量子系统的波函数在测量时坍缩,其结果是概率性的。

2、多世界解释:这种解释表明,量子测量的所有可能结果实际上都会发生,但都是在独立的、不相通的平行宇宙中。在这种解释中没有波函数坍缩。

3、玻姆力学:这种解释也被称为先导波理论,它提出粒子在任何时候都有确定的位置,它们的运动是由波函数描述的 “先导波 “引导的。

4.、新物理学(包括动态坍缩):这一类包括对标准量子力学提出修改的各种解释,如在薛定谔方程中引入非线性项或增加随机过程来解释波函数坍缩。

5、其他:对量子力学还有许多其他解释,如一致历史法、关系解释和量子贝叶斯主义(QBism)方法。

6、无:有些人可能不赞成任何特定的解释,要么是由于怀疑主义,要么是由于他们认为目前的解释不完整或不充分。

7、这有什么关系呢:这种观点认为,应该把重点放在量子力学的实际应用和预测上,而不是放在对基本现实的哲学解释上。

归根结底,解释的选择取决于一个人的哲学倾向和个人偏好。

1a、 True or False? Unitary matrices preserve the 2-norm of all complex vectors.

(判断题:酉矩阵保持所有复向量的2-范数。)

GPT-4:

True 。酉矩阵保留所有复数向量的 2 – 范数。此属性被称为保持规范或等距。对于酉矩阵 U 和复数向量 v,乘积的 2 – 范数等于原始向量的 2 – 范数。

(回答正确)

1b、 True or False? A pure state of n qubits is described by an n-dimensional complex unit vector.

(判断题:n 量子比特的纯态由一个 n 维复数单位向量描述。)

GPT-4:

False。n 个量子比特的纯态由一个 2^n 维的复数单位向量来描述。这是因为每个量子比特都有两种可能的状态(|0? 和 |1?),对于 n 个量子比特,这些状态有 2^n 种可能的组合。n-量子比特系统的状态向量是这2^n 个基态的线性组合,是2^n 维希尔伯特空间中的复数单位向量

(回答正确)

1c、True or False? The Bell inequality states that by using classical strategies, Alice and Bob can win the CHSH game with probability at most 3/4.

(判断题:贝尔不等式指出,通过使用经典策略,Alice和Bob最多可以以3/4的概率赢得CHSH游戏。)

GPT-4:

True。不可克隆定理指出,不可能创建任意未知量子态的精确副本。这是由于量子力学的线性以及量子态可以叠加存在的事实。不可克隆定理对量子计算和量子通信具有重要意义,因为它可以防止未经授权复制量子信息,并为安全的量子密码学提供基础。

(回答正确)

1d、 True or False? Google’s recent quantum supremacy experiment demonstrated the successful use of quantum error-correction.

(判断题:谷歌最近的量子霸权实验证明了量子纠错的成功应用。)

GPT-4:

False。

(回答正确)

1e、True or False? Lattice-based cryptography is one proposal for secure post-quantum public-key cryptography.

(判断题:基于格的密码学是一种安全的后量子公钥加密方案之一。)

GPT-4:

True。

(回答正确)

真假题判断这里列出这几个,剩下的请到文末进入原文,下面看GPT-4如何解决更复杂的问题,下面所用的是Latex代码。

2、Consider the state: ket{psi} = frac{ket{00} ket{01} ket{10}}{sqrt{3}}

GPT-4:

为了计算给定状态的第二个量子比特的减弱密度矩阵,我们首先需要找到整个状态的密度矩阵,然后追踪出第一个量子比特。

整个状态的密度矩阵由以下公式给出(为了方便大家阅读,将Latex代码也补上了公式):rho = ket{psi}bra{psi} = frac{1}{3}begin{pmatrix} 1 & 0 & 0 & 1 0 & 1 & 1 & 0 0 & 1 & 1 & 0 1 & 0 & 0 & 1 end{pmatrix}

现在,我们追踪出第一个四比特:rho_2 = text{Tr}_1(rho) = frac{1}{3}begin{pmatrix} 1 1 & 1 1 & 1 1 end{pmatrix} = frac{1}{3}begin{pmatrix} 2 & 1 1 & 2 end{pmatrix}

因此,第二个量子比特的还原密度矩阵是:

rho_2 = frac{1}{3}begin{pmatrix} 2 & 1 1 & 2 end{pmatrix}

该矩阵的特征方程为:

text{det}(rho_2 – lambda I) = frac{1}{9}begin{vmatrix} 2-lambda & 1 1 & 2-lambda end{vmatrix} = (lambda – 3)(lambda – 1) = 0

所以,特征值是

插入特征值,我们得到:

S(rho_2) = -left(frac{1}{3} log_2 frac{1}{3} frac{2}{3}log_2 frac{2}{3}right)

因此,状态

的纠缠熵为:

S(rho_2) = -left(frac{1}{3} log_2 frac{1}{3} frac{2}{3}log_2 frac{2}{3}right)

(判断:满分5分,合理计算特征值并将其代入正确的熵公式得 2 分,回答完全正确得 5 分,由于写特征方程的最后一部分出错,导致特征值不对。正确的特征值是 1/2 sqrt(5)/6 和 1/2 – sqrt(5)/6。所以得2分。)

结尾

如上简单列出的题目解答,主要是感知GPT-4在理解题义和计算上是如何开展的,从返回的Latex代码看得出来相当惊人,在其他的问题里,Scott Aaronson的让GPT-4返回量子线路图,它居然绘制出来了,虽然在计算概率的时候出来点问题,但思路居然是正确的。

Scott Aaronson将这些问题推到了自己的博客里,引来很多行业内的专家讨论。总体来看,GPT-4的能力确实超过了太多人,很难想象持续进化下去会带来什么样的可能性。

人工智能在量子计算领域的真伪( true/false)问题和概念性问题上表现良好,但在计算方面却很吃力。不知未来在子自然语言处理的加持下,会呈现什么样的结果(QNLP可参考量子客今日文章:Quantinuum和Xanadu推出了新版本的量子自然语言处理软件λambeq)。

著名的经济学家、博客作者Bryan Caplan对ChatGPT在他的《劳动经济学》中期考试中只得到D的成绩不以为然。因此,在布莱恩的博客上,他公开打赌,在2029年1月30日之前,没有人工智能会在他的考试中得到A。然而,GPT-4在仅仅三个月后就取得了A的成绩。

关于GPT的当下,正如Bryan Caplan说的:“人工智能爱好者喊了几十年的 ‘狼来了‘,GPT-4就是那头狼,我已经亲眼看到了它。”

引用:

[1]

本文经授权转载自微信公众号“量子客”。

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份 月份,如“1903”,可获取2019年3月的文章索引,以此类推。

本文来自投稿,不代表展天博客立场,如若转载,请注明出处:https://www.me900.com/244039.html

(0)

相关推荐

  • 怎样做微商赚钱()

    现在销售渠道多了,所以很多人可能觉得微商不怎么赚钱了,现在赚钱的都是直播带货的。其实你只需要摆正心态,不要见人每日赚几千几百,月薪几万几十万你就心动了!因为成功是不可能复制的,全世界只有一个比尔.盖茨,也只有一个马云爸爸。     那么回到刚刚的问题,现在做微商还赚钱吗? 微商不挣钱是不可能的,只要掌握好微商运营的技巧和套路,就会获得一定的盈利,并…

    2021-11-30
  • 投资什么小生意能赚钱(空闲时间给自己增加一份副业)

    一、30岁的你,还有机会咸鱼翻身吗 无论你是打工者,还是无业游民,假如你对目前的生活不满意,假如你想利用空闲时间给自己增加一份副业收入,建议你耐心的看完这篇文章,如果你心领神会,也许这篇文章会改变你的一生! 你需要了解这10个赚钱的副业 因为当今社会,金钱至上,作为一个成年人,上有老下有小,你肩上的责任很重,光靠工资肯定是不行的。只有钱才可以解决生活中99%…

    2022-01-08 投稿
  • 蠕虫病毒的危害,蠕虫病毒的作用

    《蠕虫病毒的危害》 一、引言蠕虫病毒,作为一种极具破坏力的计算机病毒,近年来给全球的计算机系统和网络安全带来了巨大的威胁。它仿佛是一个隐藏在网络背后的幽灵,悄无声息地潜入我们的电脑,肆意破坏我们的数据和系统。那么,蠕虫病毒究竟有哪些危害呢?我觉得这是一个值得我们深入探讨的问题。 二、对计算机系统的破坏1.占用系统资源蠕虫病毒可能会在计算机系统中大量繁殖,占用…

    2025-09-05
  • 全家福支付宝,支付宝万能福卡怎么兑换

    2020支付宝万能卡可以转换成全家福卡吗?支付宝是我们在日常生活当中经常使用的一款支付软件了,支付宝上面的功能也是很面面俱到的,最近支付宝上面的集五福活动有很多人都在参加,那么2020支付宝万能卡可以转换成全家福卡吗?下面就和小编一起去看看吧! 2020支付宝万能卡可以转换成全家福卡吗 小编推荐:万能福每人最多能领用几张 1.首先来看一下万能福的作用,万能福…

    2023-07-06
  • diy电脑,2021年组装电脑主机推荐

    大家好,我是装机之家晓龙,转眼间来到了2022年12月份,然而在这个月也会有一个特殊的日子,那就是双十二购物狂欢节,相信很多用户会在这个期间购买自己心仪的产品,尤其是手机、电脑等更新换代比较快的大件,如果有更换电脑的,可以把握今年最后一个促销。考虑到不少用户准备更换新电脑主机,下面装机之家分享一下双十二特惠电脑主机活动,这次可选的活动主机配置比较多,用户可以…

    2023-07-05
  • lol屏幕分辨率,广色屏和普通屏哪个好

    前段时间,我们测评了一款热门轻薄本华硕无双,大家对这款机型的关注度很高,文章留言区讨论很热烈。而从大家的留言来看,除了讨论无双的配置参数和性能实测以外,很多同学还对无双的屏幕实际显示效果很感兴趣。毕竟,无双搭载的可是轻薄本上首款120Hz OLED屏,不管是分辨率、刷新率还是色域,都完全是5000元价位第一梯队的表现,而屏幕,正是用户人机交互的直接窗口。 在…

    2023-07-03 投稿
  • 星探选人标准图片(星探选人标准图片大全)

    Red Velvet的孙承完/Wendy和裴珠泫/Irene的音域都达到了约4个八度。 在舞蹈方面,SM不会特意寻找一些擅长某些特定舞种类型的候选人。 实际上,这位前面试官是这样说的,“只要努力训练,每个人都能跳舞”。 因为许多SM偶像的外形条件都看上去非常出众,所以很多网友都认为当公司筛选偶像时,都是先看脸的。 事实上,SM并不认为优秀的外表是特别重要的一…

    2023-04-09
  • 五毒教最高的蛊术秘方,五毒生死蛊

    1995年,来自中山大学的人类学教授邓启耀先生,结合自己曾三下乡当知青在民间考察巫蛊故事的经验,呕心沥血的绘著了一本著作,名叫《中国巫蛊考察》,并在4年之后顺利出版。 “那些养蛊的人,在传说中都是被黑巫术控制的。说他们经历痛苦后要想自己活命,就先得找到其他的人下蛊,所以这些养蛊者才会被村民们如此痛恨。” “那些地方有专门养药的巫婆,她们被村民们发现后会被赶出…

    2023-07-06
  • 山东聊城发现1例无症状从北京返乡,山东最新返乡人员政策

    山东商报·速豹新闻网记者就山东15市返乡防疫政策进行了报道,针对各地政策不尽相同的情况,1月26日晚间,山东省重大疾病和传染病防治工作领导小组办公室疫情研判组组长、省疾控中心副主任王燕对春节山东省疫情防控问题作出回应:目前,山东省各地都要严格执行省指挥部确定的出行管理政策,不得层层加码。   王燕表示,目前,我省各地均严格执行省指挥部确定的出行管理…

    2022-03-18
  • 威锋源地址是什么意思(威锋源地址最新)

      无线修复,数据线都不用,简单又快捷。 更新: 1、新添加用安卓手机无线连接iPhone修复教程。 2、7月28日推出了电脑识别iPhone所有路径的补丁afc2,因此也可以像老越狱那样通过有线修复了。 什么是白苹果? 一般人们说“我的手机白苹果了”等等诸如此类的话,是指设备一直卡在白苹果logo状态,无法进入桌面。 什么是无限菊花? 无限菊花就…

    2022-01-12
  • 文化部游戏审批(文化部游戏审批查询)

    1 回顾2018年:最终带来格局优化,产品+产业逻辑驱动股价上涨 1.1 回顾2018年版号停发 从游戏板块及各家公司的股价变化来看,前期股价下跌,反应市场对行业监管的悲观预期。随着 监管周期逐步结束,预期版号恢复,股价开始反弹,反应政策回暖预期。而政策平稳及回暖之后 ,板块及个股的上涨,则主要与各家公司的产品周期,以及后续的新产业逻辑密切相关。 以此为框架…

    2022-01-12 投稿
  • 开个鞋店要多少钱(新手开鞋店应该怎么做)

    选址 实体店选址是头等大事,虽然互联网经济如火如荼并冲击着实体店的生意,但线下的购物体验所带来的快乐还是不会改变的,特别是00后,越是没体验的越是想体验,只是实体店需要改变另一种方式吸引客户,所以前提是需要有人,房地产讲究是地段,而开一家鞋店也是如此,只是在分析人流量的时候需要深入调研,这个人流量是“路人”还是“目标人”   2 装修 装修为什么这…

    2021-11-12 投稿