用ChatGPT剽窃的罪,OpenAI要亲手洗刷
本文作者:毕安娣,编辑:王靖,头图来自:视觉中国
聊天机器人ChatGPT的利用价值迅速被人类发掘:学生用它写作业、程序员让它帮忙写代码、新闻网站用它“水”文章……于是,学校不高兴了,公司不高兴了,创作者也不高兴了。
(相关资料图)
如今,ChatGPT的“造物主”OpenAI亲自出马,要解决各方人士利用这个工具“作弊”的问题。
2月1日,OpenAI宣布推出名为AI文本检测器(AI Text Classifier)的新工具,来辅助辨别文本到底是人类编写的,还是AI编写的。
目前,该工具已经可以免费试用。提交文本后,分类器会生成评估结果,包括以下5种:非常不可能、不太可能、不确定、可能、非常可能(是AI生成的)。
不过,这个AI文本分类器离成熟还很远。不仅只能识别1000字符以下的文本,而且可靠性还有待提高。
一名AI研究员Sebastian Raschka用莎士比亚《麦克白》的第一章测试该工具,得到的评估结果是“非常可能”是AI创作的。Sebastian 在推特有14万粉丝,他贴出截图后评论区有人戏谑道:“电影灵感:ChatGPT是一个时空穿越者,实际上人类的创作语言从一开始就是由它影响。”
OpenAI其实对该工具的“不完美”也开诚布公,在网页的说明部分明确写着,根据他们的测试,只有约26%的AI生成文本识别为“非常可能”,还有9%的人类创作会被误判。OpenAI表示:“它仍然存在一些局限性,因此它应该被作为确定文本来源的辅助工具,而非主要判定工具。”
与其说“不完美”,不如说这个工具还很初级。但即便如此OpenAI也迫不及待地将之发布,一方面是需要各方反馈完善工具,另一方面也是对ChatGPT引发的主要争议的一种回应。
我的罪,我自己先治了,姿态有时候比结果还重要。
一
ChatGPT已经在美国教育界引起了广泛的担忧。
美国的在线课程网站Study.com向1万名18岁以上的学生发起调查,询问他们使用ChatGPT的情况,结果竟然有89%的学生表示自己会使用ChatGPT完成作业,还有48%的学生用它完成测验,53%的学生用它写论文,22%的学生用它生成论文大纲。
即便是考虑到调查规模不大、样本代表性不佳等问题,这样的比例依然令人震惊。
《纽约时报》曾报道一个例子。美国北密歇根大学教授安东尼·奥曼(Antony Aumann)在批改学生的世界宗教课作业的时候,看到一篇文章以罩袍禁令的道德影响为题,行文段落简洁,例子准确,逻辑严密,在一众作业中很出挑。
但是安东尼教授没有直接给高分,他起了疑心。在教授的质问下,该学生向他承认,这篇文章其实是用ChatGPT生成的。
虽然教育界也有一种声音,认为应当将ChatGPT这样的新工具纳入到教学当中,而不是千方百计抵制它。也的确有一些大学开始这么做,支持的教育者认为这就像是在数学课上使用计算器,如果能减轻学生负担,用用也没问题,这可以使他们有更多时间思考深层次的问题。
但反对的声音似乎更加响亮。
1月3日,以“担心对学生学习的负面影响”以及“对内容的安全性和准确性的担忧”为由,纽约市颁布了ChatGPT禁令,不管是老师和学生,都不能通过公立学校的网络和设备使用ChatGPT。
纽约市教育局发言人称:虽然该工具能够为问题提供快速简单的答案,但并不能培养批判性思维和解决问题的能力,而这对学术成就和终生发展都至关重要。
这是一个强有力的信号:纽约市拥有全美最大的公立学校系统。
OpenAI也察觉到了争议的严重性,该公司CEO山姆·阿尔特曼(Sam Altman)曾提出要尝试用水印标记ChatGPT生成的内容。即将信号嵌入到生成的文本中,人类不能一眼看出,但是机器一验便知。
但在OpenAI还在提议时,外界早已开始行动,例如马里兰大学的几位研究者已经对语言模型输出的水印进行了深入研究。而如OpenAI新推出的工具那样直接判断文本是否为AI创作的第三方检测工具也已经流行多时。
二
一些大学已经行动起来,包括斯坦福大学在内的一些机构,联合推出名为DetectGPT的工具,来辨别AI生成的文本。
而要说第三方检测工具中,最受欢迎是GPTZero。这个工具出自一位22岁的普林斯顿大学华裔学生爱德华(Edward Tian)之手,今年1月3日上线,一周内就有超过3万人使用,一度导致程序崩溃。而推特上的演示视频,更是吸引了超过700万人次的观看。
近日,爱德华又发布了迭代版本GPTZeroX,升级的最大特点是可以识别“人类+AI”混写的文本,检测出来后由ChatGPT生成的内容会被黄色高亮标记出来。
而且GPTZeroX还可以批量导入文件,支持word、PDF和TXT等格式。这对于教师来说是一个很实用的功能,毕竟学生的作业动辄就是几十份。
GPTZero上线一天之内,已经涌进了40万访问量,收到了220万次服务请求。
爱德华表达了对教育工作者的支持,他曾在推特上表示:我承诺,本网站对个体教师和教育工作者保持免费。
除了教育领域以外,ChatGPT还带来了其他的困扰。和“学术欺诈”类似的,已经有不少程序员利用ChatGPT写代码。
此前已经有人在网上发帖称,作为初级程序员经常使用ChatGPT,但是近期突然发现在公司无法访问该工具了。
除此之外,早在去年12月,IT技术问答网站Stack Overflow就已经推出新政策,禁止用ChatGPT生成的内容在该社区回答问题。
“由于 GPT 足以让网站用户相信答案有价值,社区通常用来确定其同行贡献合法性的信号经常无法检测到 GPT 生成的答案存在严重问题。结果,客观上错误的信息进入了网站。在目前的状态下,GPT 可能会破坏读者对我们网站提供由主题专家撰写的答案的信任。”Stack Overflow如是说明。
可以说,OpenAI在2月的第一天发布AI文本辅助检测工具,不是一个令人惊讶的消息,甚至显得有些姗姗来迟。
三
根据OpenAI的说法,ChatGPT的走红实属意料之外的事情,这也可以解释为什么如今的争议OpenAI看起来毫无准备。
《财富》杂志近期的一篇深度报道称,OpenAI发布ChatGPT是抱着“孤注一掷”的态度,公司联合创始人兼现任总裁格雷戈·布罗克曼表示:“我承认,我当时的立场是,不知道它能否成功。”
OpenAI此前已经拥有全世界最强大的大预言模型之一GPT-3,以约三分之二的互联网、整个维基百科和两个大型图书数据进行集中训练,但是给出的结果总是差强人意。于是有团队提出了“强化学习”的方案,也就是让它直接与人类对话,在试错中学习。
而ChatGPT就是在这样的背景之下被推出的。
相比之下,谷歌的自然语言平台LaMDA早在2021年5月的开发者大会上初次亮相,2022年谷歌又发布了LaMDA2。在演示中,LaMDA也表现出了极其强悍的能力。甚至在去年中旬,“LaMDA已经具备意识”的都市传说曾经闹得沸沸扬扬。
但是谷歌一直不愿向公众发布LaMDA。谷歌表示,部分原因在于LaMDA存在较高的误差,且容易对用户造成伤害。此类瑕疵被谷歌称为“有毒性的”,谷歌担心贸然推出LaMDA会对公司的声誉造成影响。
而ChatGPT爆火后引发的一连串混乱,也恰恰印证了谷歌的担忧。
ChatGPT已经成为OpenAI重要的一款产品,尽管公司称走红不在计划内,这个工具还引发了各种争议,ChatGPT依然进一步使得AIGC(人工智能自动生成内容)成为当今最热门的赛道,也加速了OpenAI向商业世界的迈进。
微软和OpenAI的合作关系快速升温。在2019年就首次向OpenAI投资10亿美元的微软,在1月24日宣布已经扩大双方的合作:微软将向OpenAI进行一项为期多年、价值数十亿美元的投资,并将OpenAI的模型纳入微软的消费级和企业级产品中。
有知情人士称,投资数额将高达100亿美元。
此外,有消息称微软计划在3月将ChatGPT融入到搜索引擎必应中。谷歌也已经坐不住了,也已经发出“红色警报”,要重新思考人工智能策略,计划发布20款支持人工智能的新产品,并将在今年发布搜索聊天界面的演示版本。
2月1日,CNBC报道称谷歌正在测试一款名为“学徒巴德(Apprentice Bard)”的聊天机器人,该产品基于LaMDA,将直接与ChatGPT抗衡。最关键的是,它的回答可以包括最近的事件,而ChatGPT对2021年之后几乎一无所知。
OpenAI看起来在用一款产品去打击另一款产品,实际上是在为ChatGPT的多领域应用铺平道路。
在可以预见的将来,这个赛道将硝烟四起。ChatGPT将只是“抛砖引玉”的里程碑式印迹,还是一款长青的商业产品,还有待时间的检验。
参考资料:
1.财联社:《加码豪赌人工智能!微软官宣向大火的OpenAI追加数十亿投资》
2.硅星人:《用魔法打败魔法:抓住AI枪手 ChatGPT检测器“千呼万唤始出来”》
3.量子位:《“ChatGPT克星”升级:老师可以把全班作业丢进去检测了》
4. 新智元:《学校封杀,大厂禁用,ChatGPT引发大面积恐慌!》
5. 澎湃新闻:《聊天机器人ChatGPT成作弊工具,教育如何应对科技挑战》
标签:
相关推荐:
最新新闻:
- 用ChatGPT剽窃的罪,OpenAI要亲手洗刷
- 小米首款二合一笔记本来了,搭载骁龙 8cx Gen2:聚看点
- 全球热点评!曲面屏逐渐退场,三星拥抱直屏,Galaxy S23 Ultra曲面收窄30%
- 小米POCO X5系列真机照曝光:2月6日在印度发布
- 开学季作业打印怎么办?汉印打印机U200让作业打印更简单
- 当前视讯!网易开放暴雪游戏退款通道,排队人数超过 90 万
- MetaVR部门Q4亏损40亿美元 今年还将继续增加投资
- 当前最新:就是不认通胀放缓!美联储甚至发明了新标准:“超级核心”通胀
- 广西工业龙头企业最新名单公布 工业富联南宁公司上榜
- 苏黎世保险集团选择亚马逊云科技加速数字化转型 为客户提供全新体验_今亮点
- 每日头条!1月安卓旗舰性能榜,第一毫无悬念
- 【新视野】约4700元!AMD锐龙9 7950X3D于2月28日推出
- 【天天新要闻】索尼相机工厂退出中国!
- 每日消息!“任亏卷”上架美服eshop:100美元换2款第一方游戏
- 世界焦点!据报道:任天堂缺席今年E3是因没有足够的游戏进行展示
- 微软推出基于ChatGPT高端版Teams 7月涨至10美元-热门看点
- 米哈游起诉原神泄密者胜诉 获赔15000元
- 6.5万元电脑运损已买报价仍不处理 顺丰回应会跟进-精彩看点
- 世界快看:大秦最后一员骁将,一生报国无门的“悲剧英雄”章邯
- 天天快看点丨《蚁人与黄蜂女》发布全新宣传片:一幕幕尽是回忆
- 魅族申请新 MEIZU Logo,或为魅族汽车车标
- 当前要闻:世界湿地日|走进“湿地之都”盘锦 领略生态之美
- 安卓机皇回归!三星宣布推出配备2亿像素摄像头的新Galaxy S23 Ultra
- 世界新动态:决胜2023,金帝2022总结表彰暨2023宣誓大会圆满举行!
- coreldraw复制快捷键是什么?cdr怎么等距离连续复制?
- 电脑突然重启了是怎么回事?电脑自动重启有什么原因?
- 虚拟内存最小值太低怎样解决?虚拟内存最大最小值怎样设置?
- 怎么设置电脑开机自动宽带连接? 开机自动宽带连接的设置方法
- 内存工作频率是什么?内存工作频率越高越好吗?
- 蓝屏代码0x000050怎么解决?详细的蓝屏错误代码解决
- 开机自动打开文件夹怎么处理?开机启动项怎么关闭?
- 环球观察:一文看懂三星Galaxy S23全新三款区别
- 本地网速测试有哪些方法?本地网速测试方法介绍
- 百事通!屏幕增大到2.1英寸!曝更大屏的新Apple Watch Ultra明年发布
- 网站域名被封如何做?怎么解决网站域名被封问题?
- ADSL是什么?ADSL宽带上网使用方法
- itools怎么用?itools使用方法步骤
- drivers是什么文件?drivers文件可以删除吗?
- CMCC是什么意思?CMCC网络又是什么含义?
- win8专业版密钥有哪些?win8专业版激活码大全
- 缩水U盘是什么?教你认识缩水U盘以及还原方法
- 电脑硬盘分区表错误有什么解决办法?怎样修复分区表?
- 百度云离线下载出现36000错误的原因是什么?原因分析及解决方法
- 电脑小键盘被锁住了是怎么回事?电脑键盘锁住了怎么办?
- 显卡风扇响声大怎么处理?造成显卡风扇噪音大的原因
- 电脑时间不能同步是什么原因?电脑时间不能同步解决方法
- 环球快播:《猎天使魔女3》推出游戏原声带 3月29日正式发售
- 《曼达洛人》第三季新海报 星际父子继续展开冒险
- 快资讯:Keywords收购美国游戏公关公司Fortyseven
- B社《红霞岛》需全程联网:不能单人离线游玩_世界百事通
- 今日热门!多人间谍游戏《欺骗公司》3月21日发售 登陆PC/主机
- 环球观速讯丨小岛秀夫分享《死亡搁浅2》“实验”照 将使用新技术
- 瑞典宣布将致力改善该国未来游戏开发者严重短缺问题
- 环球快播:沧州明珠:子公司参与竞拍受让沧州明珠锂电隔膜剩余10%股权,竞拍底价7573万元
- 老年人,困在漫漫长夜里_世界新要闻
- 世界观察:年轻人如何半价在北京买第一套房?
- 净水产品分销协议合同范本(汇总21篇)|环球观焦点
- dnf怎么上不去了是什么原因?电脑登不上dnf的解决方法
- 全国联保是什么意思?全国联保和店保的区别在哪?
- 暴雪战网怎么用网易账号登录?暴雪战网网易账号连接方法是什么?
- lightroom软件好用吗?lightroom序列号及激活方法
- 任务栏经常假死为什么?win10任务栏经常假死怎么办?
- 环球信息:轻薄本性能释放115W?联想小新新品曝光
- 当前播报:Windows 10正式停售了 2年后停止支持
- dsound.dll是什么文件?没有找到dsound.dll该怎么办?
- win10系统pnkbstra.exe是什么?pnkbstra.exe进程关闭方法
- 网游加速器真的有用么?网络加速器介绍
- winaircrackpack怎么用?winaircrackpack使用教程
- pcas.exe是什么进程?怎么关闭pcas.exe进程?
- formatconverters.exe是什么软件?formatconverters.exe使用说明及注意事项
- whatsapp是什么软件?whatsapp与微信有什么区别?
- GGhost一键恢复怎么用?GGhost一键恢复使用教程
- 应用程序正常初始化失败怎么解决?初始化失败的处理经验
- dat文件是什么?怎么打开dat文件?
- 如何添加识别码?添加五笔识别码的方法步骤