近日,非营利人工智能研究组织OpenAI 推出了AI聊天机器人ChatGPT,它可以跟用户聊天,也能回答一系列问题,并在不到一周的时间里拥有超过100 万名使用者。由于该模型仍处于研究预览阶段,因此开放用户免费试用,但不会永久开放免费使用。
那么,这个火爆全网的ChatGPT 到底是什么呢?它是如何运作的?作为能够智能对话的模型,它能够取代Google吗?
ChatGPT 的推出和爆火,用户破亿
2022 年11 月30 日,非营利人工智能研究组织OpenAI 宣布推出新型聊天机器人模型ChatGPT ,得到了很多用户的欢迎。由于该模型一开始为研究预览阶段,因此开放用户免费试用。
目前,用户只需进行注册,就可开始与ChatGPT 3.5 免费互动,ChatGPT 甚至还支持中文等多国语言。不过对于ChatGPT 4 以及相关更进阶功能则需升级才能使用。
据彭博报导,ChatGPT 在开放试用后,在网络上掀起一场热潮,从回答历史争议、到为加密货币赋诗,用户们在推特分享ChatGPT 提供的详细解答,并对此感到惊讶,一名试用者就分享测试心得直言,ChatGPT 能轻易完成1000 字的大学回家作业论述文。
此外,OpenAI 执行长Sam Altman 在5 日发推披露,在ChatGPT 上周三推出之后,迄今已有超过100 万名使用者。
据瑞银集团的一份报告显示,在ChatGPT 推出仅两个月后,它在2023 年1 月末的月活跃用户已经突破了1 亿,成为史上用户增长速度最快的消费级应用程式。值得注意的是,TikTok 达到1 亿用户用了9 个月,Instagram 则花了2 年半的时间。
ChatGPT 是什么?它特别在哪里?
那么,这么好用的机器人ChatGPT 到底是什么?为什么会一夜间红遍网络呢?
在了解ChatGPT 是什么前,我们首先需要简单了解一下它的公司。
1、OpenAI 公司介绍
OpenAI总部位于旧金山,由特斯拉执行长马斯克、Sam Altman 及其他投资者在7 年前共同创立,目标是开发「造福全人类」的人工智慧技术,但马斯克在2018 年时因针对公司发展方向存在分歧而离去。
此前, OpenAI因推出GPT-3 自然语言处理模型而闻名于世,该模型允许AI 对文本做出智能反应。而目前推出的ChatGPT 或将是OpenAI 的GPT-4 正式推出之前的序章。
2、ChatGPT 聊天机器人介绍
ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的输入,产生相应的回应。通过学习大量现成文本,ChatGPT 能够模拟人类的对话方式,在自然语言理解和生成方面有显著进步。
用户在注册ChatGPT 后,可以要求ChatGPT 回答问题,例如:「谁是1955年的美国总统」、「生命的意义是什么」、「如果今天外面有摄氏4.4度,我应该穿什么」等问题。对于穿着,ChatGPT 回答,穿着取决于你的活动,如果你要外出,你可以穿薄外套或毛衣、长裤和不露脚趾的鞋子,如果你想在室内,就穿T恤、牛仔裤或其他舒适的衣服。
比起传统文字生成AI 领域仅来自资料库的规律资料,弱点诸如简单识别并预测给定文字串内容(鹦鹉学舌)、资料库过时等等。ChatGPT 改编自OpenAI 的GPT-3.5 模型,除了对答流畅,还能记住使用者先前的对话内容,表现更为人性,对2021 年之后发生的事有一定了解,可说是目前为止最懂得沟通的AI,以更人性化的方式处理用户的自然语言。
不过,ChatGPT 拒绝回答许多可能有害的问题(例如与仇恨言论,暴力内容或如何制造炸弹等主题相关),因为这些答案将违背其「程式设计和目的」。OpenAI 通过预置所有输入的特殊提示以及使用一种称为「从人类反馈中强化学习」(RLHF)的技术来实现这一点,该技术可以根据人类对其生成的回应进行评分来微调AI 模型。
此外,除了对话外,各国网友正在尝试寻找ChatGPT 的潜在用途,例如ChatGPT 可以写诗、用详细的例子纠正编码错误、编写新代码、阐述热狗作为三明治的哲学。
3、ChatGPT 官方APP 正式上线
ChatGPT 推出后便大受欢迎,但另不少人感到遗憾的是,ChatGPT 没有手机版本,只能在网页上使用,或使用接入GPT-3 / GPT3.5 的第三方 app。
2023 年5 月19 日,官方ChatGPT 手机版本正式上线,而且提供GPT-3.5 和目前最新、最强大的GPT-4 模型选择,让使用者可以跟AI 尽情对话。
ChatGPT APP 将是免费使用的,最初只开放美国以及特定市场,现在已推送至152 个国家。根据OpenAI的说法,推出iOS App是他们将最先进的研究成果转化成一款实用工具的第一步,未来也会不断降低使用门槛。
GPT-3 模型是什么?
实际上,GPT-3 就是一个简单的统计语言模型。从机器学习的角度,语言模型是对词语序列的概率分布的建模,即利用已经说过的片段作为条件预测下一个时刻不同词语出现的概率分布。语言模型一方面可以衡量一个句子符合语言文法的程度(例如衡量人机对话系统自动产生的回复是否自然流畅),同时也可以用来预测生成新的句子。例如,对于一个片段「中午12 点了,我们一起去餐厅」,语言模型可以预测「餐厅」后面可能出现的词语。一般的语言模型会预测下一个词语是「吃饭」,强大的语言模型能够捕捉时间信息并且预测产生符合语境的词语「吃午饭」。
通常,一个语言模型是否强大主要取决于两点:首先看该模型是否能够利用所有的历史上下文信息,上述例子中如果无法捕捉「中午12 点」这个远距离的语义信息,语言模型几乎无法预测下一个词语「吃午饭」。其次,还要看是否有足够丰富的历史上下文可供模型学习,也就是说训练语料是否足够丰富。由于语言模型属于自监督学习,优化目标是最大化所见文本的语言模型概率,因此任何文本无需标注即可作为训练数据。
由于GPT-3 更强的性能和明显更多的参数,它包含了更多的主题文本,显然优于前代的GPT-2。作为目前最大的密集型神经网络,GPT-3 能够将网页描述转换为相应代码、模仿人类叙事、创作定制诗歌、生成游戏剧本,甚至模仿已故的各位哲学家——预测生命的真谛。且GPT-3 不需要微调,在处理语法难题方面,它只需要一些输出类型的样本(少量学习)。可以说GPT-3 似乎已经满足了我们对于语言专家的一切想像。
GPT-3 存在哪些局限性?
但是GTP-3 并不完美,当前有人们最担忧人工智能的主要问题之一,就是聊天机器人和文本生成工具等很可能会不分青红皂白和质量好坏,地对网络上的所有文本进行学习,进而生产出错误的、恶意冒犯的、甚至是攻击性的语言输出,这将会充分影响到它们的下一步应用。
OpenAI 也曾经提出,会在不久的将来发布更为强大的GPT-4:
据说,GPT-4 会在明年发布,它能够通过图灵测试,并且能够先进到和人类没有区别,除此之外,企业引进GPT-4 的成本也将大规模下降。
更强的GPT-4 上线!GPT-5 蓄势待发
2023 年3 月14 日,ChatGPT 开发商 OpenAI 宣布,最新版大型语言模型「GPT-4」上线,其准确度相较3.5 版本高出40%。
OpenAI 宣称,GPT-4 在许多专业测试的表现已「可媲美人类」(human-level performance),该模型能在美国大学的入学SAT测验击败90%人类、并在律师资格考试(Bar examination)击败90%受试者。
目前,GPT-4 已正式开放试用。
OpenAI 表示,GPT-4 将提供ChatGPT 付费订阅户使用,也可做为应用程式开发介面(API)的一部分,让程式设计师把这款AI整合至手中的app。而至于GPT-4 的API,现在OpenAI 开放了等待表单,未来使用者可以依照呼叫API 的次数付费。
除此之外,OpenAI 在3 月26 日公布了 GPT-4.5 的细节。根据官方给出的讯息,GPT-4.5 模型是GPT-4 和即将推出的GPT-5 之间的一个重要中间版本。而GPT-5 将在2023 Q4 推出,该模型或将实现AGI (通用人工智慧) 的目标。
ChatGPT怎么用?
ChatGPT不只能回应广泛的主题问答,使用者纷纷想找出它的底线,以下是曾被测试的应用范围:
- 回覆客诉、客服对话:直接丢入客诉信件,请ChatGPT回应一段简短的信件。
- 故事创作:有人透过ChatGPT完成短篇故事,也有人结合ChatGPT与图像创作工具MidJourney完成图文并茂的儿童绘本——但此本书遭批评思虑不周、有抄袭嫌疑。
- 写程式: ChatGPT已依使用者需求,写出虚拟货币交易所的应用程式介面(API),为使用者下单。
- 翻译:输入中文或英文,能要求ChatGPT为你翻译成另一种语言。
- 修改文法错误:输入一大段文字后,能请ChatGPT为你判断哪些文法出错,甚至能告诉你原因、如何修正。
- 写诗、歌词:给予关键字,ChatGPT就能写出符合主题、字数的诗词或歌词等文字创作。
- 整理文字重点:能阅读长篇大论的文本,并条列、分类出重点,适合会议记录使用。
您也可以登录ChatGPT 探索其更多的用途。
木头姐预测:2023 年ChatGPT 应用将可达Google 搜索规模
方舟投资(Ark Invest)在2023 年2 月1 日发布「 Big Ideas 2023」展望报告中谈到ChatGPT 。
方舟表示在发布后的五天内,ChatGPT 用户数量就达到100 万人次,虽然运行该模型的推估成本目前是每次搜索约0.01 美元,但是莱特定律表明,到2030 年,ChatGPT 类型的应用将可以达到Google 搜索的部署规模,每日可处理85 亿次搜索。
到2030 年,预计AI 将使知识型员工生产率提高4 倍以上,若100% 采用AI,只要支出约41 兆美元,就可提高劳动生产率约200 兆美元,使约32 兆美元的知识工作者薪资相形见绌,并与当前预期的2030 年全球GDP 规模相匹敌。
ChatGPT 能否取代Google?
外界公认ChatGPT 在AI 界最大的突破,就是能处理非常广泛的主题。再者,ChatGPT 以对话的方式进行互动,以人们无法企及的速度打包整理资讯,甚至能处理对话中出现的不同人物、地点和时间等资讯;可以把它理解成文字版的Siri 或Alexa,但ChatGPT 更能理解问题、更知道用户想要什么。
专家也认为,ChatGPT 首先威胁到的就是搜索引擎。比起一条条的蓝色连结列表,整理好的资讯、有逻辑的解释,似乎更吸引人。
那么,这是不是意味着我们不用再拿关键字去喂Google,就能直接获得想要的答案呢?
接下来我们将从两点进行观察:
观察点一:ChatGPT可自行生成内容,并结合前后文意对话
目前搜索引擎的运作方式(如Google),是汇集大量资讯,而非创造资讯。透过在输入框输入关键字,搜索引擎会透过算法,抓取、索引以及排序匹配的资讯,然后再由用户寻找自己需要的内容。但ChatGPT 很不一样的是,可自己生成内容,给出单一、即时的答案,还能结合前后文意,进行多轮对话 。
观察点二:ChatGPT能不能判断讯息真伪?
不过,虽然ChatGPT 资料源自于大量网络内容,但也会有出错的时候;而使用搜索引擎可以从多个资料来源交叉对比。去年华盛顿大学语言学教授Emily Bender 与前Google 伦理AI 主管Timnit Gebru 合着的论文曾经提到这一点,AI 语言模型本质只是「随机鹦鹉」(stochastic parrots)也就是说,他们的知识仅来自训练数据中的统计规律,而不是像人类能对世界的复杂和抽象进行理解。
甚至,推特(Twitter)现任执行长伊隆.马斯克(Elon Musk)透露,ChatGPT 可以使用Twitter 资料库,且众所皆知Twitter 垃圾讯息泛滥。这表示ChatGPT 必然学到了许多缺少事实核查的内容,甚至被用来生成不实的消息、恶意散播。
因此,从现在来看,ChatGPT 取代Google 等搜索引擎的可能性是比较小的。因为现阶段的ChatGPT 仍旧与其他AI 聊天机器人有一样的问题,那就是会以不正确的答案或假讯息回应。开发人员也承认,该模型「有时会写出貌似合理、但不正确或荒谬的答案」,并指该模型由于接受了人类训练,可能回答会「过于冗长」,一些用户就反馈,该模型针对代数提供了详细、但不正确的解答,还会回答血腥、犯罪、种族主义的限制性议题。
总的来说,归根到底ChatGPT 是一款AI 对话模型,并非搜索引擎,无法提供各式资讯。而且我们平时在网络上搜索到的资料也并非完全正确,各式的资讯与内容仍需要我们自己去做判断。所以说,ChatGPT是不太可能取代搜索引擎Google 的。
ChatGPT 冲击搜索引起行业,谷歌Bard对战却闹出乌龙
尽管目前ChatGPT 暂时不太可能代替谷歌等搜索引擎,但毫无疑问的是,ChatGPT 的爆火对Google 等搜索引擎的地位造成了强烈的冲击。
Google 的第23号员工、创立Gmail服务的前Google员工Paul Buchheit表示,诸如近期走红的ChatGPT人工智慧技术应用发展,可能会在一两年内就会「摧毁」Google过去以来建立建立发展优势。
Paul Buchheit认为,如同当年Google推出的搜寻引擎技术在短时间内毁掉黄页式资料查询网站使用模式,现今的Google服务也可能也会在短时间内被大量兴起人工智慧技术击败。
因此,为了迎战ChatGPT,保持自己的霸主地位,Google 母公司在2023 年2 月6 日宣布,将推出聊天机器人Bard,并为旗下搜寻引擎及开发者增加人工智慧(AI)功能。
目前不清楚Google打算如何让Bard与OpenAI的ChatGPT有所区别。但Pichai 表示,新服务会运用网络上的资讯,而ChatGPT的知识库是更新到2021年。
然而,Bard却在近期发表会上出包,导致当周 Google 股价市值蒸发逾1500 亿美元。谷歌员工在内部论坛上直批执行长推出Bard 太过仓促,一点不像Google 作风。
AI 会取代人力吗? ChatGPT 对就业市场有何影响?
不过,这也引发了另一个问题,ChatGPT 等智能AI 这会不会取代一些工作?
虽然许多用户表示,根据大量测试结果,ChatGPT 并不是那么聪明,但各行各业的专业人士都开始担心。程式可以仰赖AI、学术论文甚至可以回避反剽窃软体,饭碗不保、知识原创性出现危机。
根据TechCrunch与麻省理工学院的研究员兼经济学家、风险投资者Paul Kedrosky的访谈,Kedrosky认为,「 OpenAI 正在推动美国经济100 年来最具破坏性的变化 。」
在访谈中,Kedrosky 用机械化的汽车工厂来比喻,指出这与自动化进入汽车工厂、并且让汽车工人失,很不一样,「制造工厂中的机器人虽然对在工厂工作的人们造成了破坏性的影响,并产生了令人难以置信的经济后果,但它们并没有转身开始『吸收』工厂内部的一切,一个部门接着一个部门吸收。而这不仅仅是我们可以预想到的,且这是你应该预想到的。」
此外,Kedrosky 也认为ChatGPT 对高等教育来说也是个威胁,尤其ChatGPT 用于撰写论文可以算是剽窃,「写文章的目的是为了证明你可以思考,但缩短了(写作)过程、且达不到目的 ……我们不再知道他们有没有作弊,所以这表示,一切都必须在课堂上完成(作业)并且必须受到监督。」这都需要更多教育工作者在第一线努力,因此学校可能会变得更贵、更小。
但对于未来职业的威胁,Kedrosky 仍同意比较乐观的看法,「……只要有『颠覆』,就会有其他机会,人是会流动的,会从一个地方到另一个地方、从一个职业到另一个职业。我们不应该如此固执,认为这个技术(AI)的发展让我们无法改变或是迁移。」
不过OpenAI 的执行长阿特曼(Sam Altman)表示,ChatGPT 主要功能还是协助使用者节省更多时间,比如透过AI快速整理长篇内容中的重点摘要、检查复杂程式编码内容是否有误,即便自动产出的文字内容大多数都符合逻辑和语意,但仍需要真人检查与修饰,无法取代单一工作职位。
ChatGPT 对话成本仅为几美分,仍值得期待
目前,ChatGPT 仍是免费试用转态。对于 ChatGPT 聊天的平均费用,OpenAI 执行长Sam Altman 表示,「每次对话的平均费用可能只有几美分,我们正试图寻找更精确的测量方法,并优化它。」
但Altman 也直言, ChatGPT 不会永久免费,「我们将不得不在某个时候,以某种方式将其货币化;因为成本高昂。」
不过,处于开发阶段的GPTChat 还是很令人惊艳,值得网友们去探索,发现聊天机器人的无限潜力。
ChatGPT 推付费版,和免费版有什么不同?
2023 年2 月1 日,OpenAI 正式推出了付费订阅版ChatGPT Plus,每月收费20美元。付费后,使用者可以在高峰时段继续使用ChatGPT,并提前获得新功能与改进,服务响应时间也将有所缩短。
当然,OpenAI 并不强制用户使用付费版本,并强调将继续提供ChatGPT免费版服务。但据《纽约时报》报导,在高峰时段,免费版访问人数将受到限制。
ChatGPT 掀起AI 热潮
ChatGPT 无疑是迄今为止被炒作得最厉害的AI 应用,很多人甚至认为它代表了AI 的未来。在传出微软考虑再向ChatGPT 的开发者OpenAI 投资100 亿美元后,更是激励ChatGPT 及相关AI 项目的暴涨。
自上周传出微软将加码投资OpenAI 以来,过去一周,人工智慧相关概念币全面大涨。
据CoinGecko 数据显示,有五种AI 概念币涨幅在100% 以上,另有7 种AI 概念币涨幅在20% 至65% 之间。
基于动画的AI 图像生成器项目Image Generation AI(ImgnAI)涨幅最大,达到380.2% ,其他涨幅在100% 以上的AI 概念币,包括Artificial Liquid Intelligence(ALI)的171.7%、SingularityNET(AGIX)的160.1 %、GNY 的105.1%、Botto 的100.4%。
ChatGPT的未来前景如何?
矽谷乃至整个世界都在等待的是GPT-4 的到来。
GPT-4 确实很快就要来了(根据一些传言,这个时间可能是2023 年春天)。当它问世时,将会令ChatGPT 黯然失色;可以肯定的是,会有更多人讨论它……
GPT-4 很快就会面世,带来的经济冲击也许会像新冠疫情一样。GPT-4 的即时分发可为数亿知识工作者带来近乎即时的采用与近乎即时的生产力提升。
就技术而言,GPT-4 将内建更多的参数,而这需要将更多处理器和记忆体捆绑在一起,并用更多的资料进行训练。GPT-1 的训练量是4.6 GB 资料,GPT-2 的训练量是46 GB 资料,GPT-3 的训练量是750 GB 资料。GPT-4 的训练量将更可观,也许要占网络的很大一部分。正如OpenAI 已经了解到的那样,从很多方面来说,更大意味着更好,每次迭代的输出都会越来越像人类。GPT-4 会变成一个怪物。
但它能解决我们之前看到的问题吗?我不太确定。
尽管GPT-4 看起来肯定要比它的前辈更聪明,但它的内部架构问题依旧。我怀疑我们会看到一个熟悉的模式:一开始火爆异常,接着接受更仔细的科学审查,然后是大家认识到许多问题仍然存在。