手机游戏巴士

那个20多万“不可描述”照片的数据集,有人用它做了鉴黄模型

发表于:2024-11-16 作者:游戏编辑
编辑最后更新 2024年11月16日,三井发自凹非寺量子位报道|公众号QbitAI有人上手了!近日,GitHub出现一个名为“NSFWModel”的项目。通俗一点来说,就是一个鉴黄模型。这个模型,使...

三井 发自 凹非寺

量子位 报道 | 公众号 QbitAI

有人上手了!

近日, GitHub出现一个名为“NSFW Model”的项目。通俗一点来说,就是一个鉴黄模型。

这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张“不可描述”图片。

同时,这个模型也被项目的贡献者做成了Demo。

既然有了Demo,那肯定是免不了测试一番……

Demo效果

Demo网站十分简单,进去之后能做什么一目了然。

上传图片之后,是自动给出结果,不需要点击其他按钮。但有时候不会给出结果…..还有待完善。

结果是数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn。具体每个类别代表的意思,如下图所示:

好了,开始第一个测试:

这个图有71%的可能性是hentai;16%的可能性是porn。你觉得准吗?

再来一个:

71%的可能性是sexy。

但下面这个,就有点不好说了。

porn到了76%,19%是hentai。按照这个标准,《超体》别想正常上映了……

但整体上,这个模型还是能工作的,比如整个漫画,就很好的识别出来了,比如其他的一些,也能识别出来(但图片就不好放了)。

至于准确率怎么样,没法给出定论。如果你有兴趣,可以去体验下这个Demo。地址:

话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码。

请收好项目地址:

https://github.com/rockyzhengwu/nsfw

最后,数据集地址:

https://github.com/alexkimxyz/nsfw_data_scrapper

One More Thing

在Demo网站的下方,写了一句爱因斯坦的话:

Two things are infinite: the universe and human stupidity; and I’m not sure about the universe.

只有两样东西是无限的,就是宇宙,还有人类的愚蠢,不过我对前者还没什么把握。

作者系网易新闻·网易号“各有态度”签约作者

2018中国人工智能明星创业公司

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

喜欢就点“好看”吧 !





0