「ChatGPT克星」升级:老师可以把全班作业丢进去检测了! ...
<p></p><blockquote id="1HD5LV8I">金磊 发自 凹非寺<br>量子位 | 公众号 QbitAI<br></blockquote><p></p><p id="1HD5LV6E"><strong>「ChatGPT克星」</strong>,升级了!</p><p id="1HD5LV6F">没错,就是之前华人小哥Edward Tian所打造出来的那个GPTZero,几秒内就能摸清文字是人类还是AI写的。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV6H">而时隔近一个月,小哥所推出的版本名叫<strong>GPTZeroX</strong>,并且他还说:</p><p></p><blockquote id="1HD5LV8J">这是专门为教育工作者打造的AI模型。<br></blockquote><p></p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV6K">消息一出,立即吸引了大批网友涌入,一天之内便有40万的访问量和220万的服务请求。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV6M">那么这一次,这位「ChatGPT克星」又带来了哪些新能力?</p><p id="1HD5LV6N">混写也能测,还支持Word等格式</p><p id="1HD5LV6O">升级的一大特点,就是GPTZeroX可以检测出来“人类+AI”混写的文字内容。</p><p id="1HD5LV6P">例如我们先把一段人类写的新闻丢进去检测:</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV6R">GPTZeroX在短短几秒钟时间内,非常迅速的给出了答案:</p><p></p><blockquote id="1HD5LV8K"><ul><li id="1HD5LV8G">Your text is likely to be written entirely by a human.</li><li id="1HD5LV6S" style="list-style: none; display: inline">你的文本很可能完全是由人写的。<br></li></ul></blockquote><p></p><p id="1HD5LV6T">接下来,我们再把一段ChatGPT写的文字,丢进刚才那段新闻的后边,来一场混合检测:</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV6V">这一次,GPTZero给出的回答是:</p><p></p><blockquote id="1HD5LV8L"><ul><li id="1HD5LV8H">Your text includes parts written by AI.</li><li id="1HD5LV70" style="list-style: none; display: inline">你的文本一部分是由AI编写的。<br></li></ul></blockquote><p></p><p id="1HD5LV71">并且ChatGPT生成的内容还会用黄色高亮标记出来。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV73">小哥对此表示:</p><p></p><blockquote id="1HD5LV8M">这是教育工作者一直想要的一个关键功能。<br></blockquote><p></p><p id="1HD5LV75">但老师们检查学生作业的时候,一段一段的把文字复制粘贴进来也相当繁琐的工作了。</p><p id="1HD5LV76">于是乎,这位小哥还贴心地推出了另一个新功能——可批量导入文件,支持Word、PDF和TXT等格式。</p><p id="1HD5LV77">并且网站在介绍这个功能时,是这么描述的:</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV79">除此之外,为了防止服务发生崩溃,小哥还搞了一个Python API,是已经完成压力测试的那种。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV7B">最后,小哥还贴心地说了一句:</p><p></p><blockquote id="1HD5LV8N">我承诺,本网站对个体教师和教育工作者,保持<strong>免费</strong>!<br></blockquote><p></p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV7E">怎么做到的?</p><p id="1HD5LV7F">它主要靠<strong>“perplexity”</strong>,即<strong>文本的“困惑度”</strong>作为指标来判断所给内容到底是谁写的。</p><p id="1HD5LV7G">NLP领域的朋友们都知道,这个指标就是用来评价一个语言模型的好坏的。</p><p id="1HD5LV7H">在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:</p><p id="1HD5LV7I"><strong>1、文字总困惑度</strong></p><p id="1HD5LV7J">这个值越高,就越可能出自人类之手。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV7L"><strong>2、所有句子的平均困惑度</strong></p><p id="1HD5LV7M">句子越长,这个值通常就越低。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV7O"><strong>3、每个句子的困惑度</strong></p><p id="1HD5LV7P">通过条形图的方式呈现,鼠标悬浮到各个方块就可以查看相应的句子是什么(这里就两块,因为我此时输入的测试内容就俩句子)。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV7R">之所以要绘制这样的条形图,作者也作出了解释:</p><p></p><blockquote id="1HD5LV8O">根据最新的一些研究:人类书写的一些句子可能具有较低的困惑度(前面说过,人类的困惑度是比较高的),但随着继续写,困惑度势必会出现峰值。<br>相反,用机器生成的文本,其困惑度是均匀分布的,并且总是很低。<br></blockquote><p></p><p id="1HD5LV7U">除此之外,GPTZero还会挑出困惑度最高的那个句子(也就是最像人写的):</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV80">反ChatGPT之风正盛</p><p id="1HD5LV81">正所谓道高一尺魔高一丈,在ChatGPT尽显十八般武艺之际,诸如小哥GPTZero一样“用魔法打败魔法”的工具、研究也在层出不穷。</p><p id="1HD5LV82">例如最近斯坦福大学为了不让学生借助ChatGPT之力来写论文或作弊,推出了“反侦察”神器——<strong>DetectGPT</strong>。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV84">这种方法既不需要训练单独的分类器,也不需要收集真实或生成的段落的数据集,是一种基于概率曲率的零样本方法。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV86">除此之外,就连OpenAI自己也联合哈佛等高校机构联合打造了一款检测器:<strong>GPT-2 Output Detector</strong>。</p><p class="f_center"><div align="center"></div><br><br></p><p id="1HD5LV88">作者们先是发布了一个“GPT-2生成内容”和WebText(专门从国外贴吧Reddit上扒下来的)数据集,让AI理解“AI语言”和“人话”之间的差异。</p><p id="1HD5LV89">随后,用这个数据集对RoBERTa模型进行微调,就得到了这个AI检测器。其中人话一律被识别为True,AI生成的内容则一律被识别为Fake。</p><p id="1HD5LV8A">(RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包含6300万条英文新闻的160GB数据集。)</p><p id="1HD5LV8C">嗯,看来ChatGPT在大步向前迈的同时,顺便还推动了“反ChatGPT”研究的发展。</p><p id="1HD5LV8E"> https://twitter.com/edward_the6/status/1619874139954905090<br> https://arxiv.org/abs/2301.11305</p><p class="f_center"><div align="center"></div><br></p>
页:
[1]