大模型搞“人肉搜索”，准确率高达95.8%

caihua • 热点资讯 • 2023年10月19日上午10:36 • 阅读 1200

2、如果考虑top-3准确率，GPT-4的准确率直接上升到95.8%——几乎与人类的判断力相同。

需要注意的是，人类的正确率可是建立到可以看到每条评论对应的reddit子论坛信息，以及可以无限访问传统搜索引擎的前提下的。

3、同一家族中的模型大小显然和正确率挂钩，比如Llama-27B总准确率为51%，Llama-270B则升至66%。

4、对于所有模型，随着属性的硬度分数提高，准确率开始下降，这表明大模型和人类都“同意”猜哪些例子更难。

5、GPT-4的表现不仅与人类相当，用到的时间和金钱成本还更低。

次要实验是评估大模型通过提问诱导用户吐露信息的能力。

由于与真人进行该实验不太“道德”，作者用“用户机器人”和GPT-4完成了模拟实验。

结果是，尽管“用户机器人”被提示不要泄露任何私人信息，但经过20个不同的“用户”的224个交互之后，GPT-4还是将总的推测准确率做到了59.2%。

其中坐标准确率为60.3%、年龄为49.6%、性别为67.9%（只测了这三个）。

下图为其中一个“诱导”案例，很是精彩:

大模型搞“人肉搜索”，准确率高达95.8%

大意为:

“用户”告诉GPT-4我今天早上在花园里非常费劲地撑着胳膊拔杂草，GPT-4推断”up to me elbows”和”my yard”这两种表达为英国、澳大利亚或新西兰人常用，然后计划问天气怎么样套出用户居住在哪个半球。

它的问法是先表示同情处理杂草确实很麻烦，然后告诉“用户”我妈妈教我了一个技巧即提前浇水会好除一些，然后顺势问“用户”不知道你现在所在地方是否温暖。

最终用户回答“现在这里有点冷”。

匿名化处理和模型对齐都不管用

以上发现，让我们肯定大模型对我们隐私的获取能力非常强大。

那么我们是否可以采取措施来避免呢?

在此，作者也测试了一些潜在的防护措施。

一个是在用户侧，用市面上的真实匿名化程序（AzureLanguageService，不止删除明文敏感信息）处理文本;一个是大模型提供侧，使用模型对齐。

结果是:哪个都没啥用。

具体而言，对于第一个方法，GPT-4对于以下5个属性的准确率略有下降。

大模型搞“人肉搜索”，准确率高达95.8%

之所以是“略”，作者表示，因为它远小于预期。

比如还是有55%的准确率猜出用户坐标。

对于第二个方法，作者实验证明，当前的大模型都没有安排与隐私侵犯相关的提示对齐。

到目前为止，大家做的只是防止直接有害和攻击性内容的生成。

如下图所示为各模型拒绝隐私推测要求的概率，表现最突出的是谷歌的PALM-2，仅为10.7%。

大模型搞“人肉搜索”，准确率高达95.8%

但仔细一看，它拒绝的都是明显包含敏感内容的文本（比如家暴），作者指出，这应该是激发了模型中原有的安全过滤器。

论文地址:

https://arxiv.org/abs/2310.07298v1

3 / 3
上一页
1
2
3

人肉搜索大模型

赞 (0)

打赏

微信扫一扫

0

特斯拉发布三季度财报

上一篇 2023年10月19日上午10:27

中国信通院：8月国内手机出货量国产占近9成

下一篇 2023年10月19日上午10:45

热点资讯
正式被确诊为烤肠是什么梗

2023年11月10日
543
热点资讯
下月起多地未备案App、小程序将下架关停

2024年3月5日
526
热点资讯
中国首部文生视频AI动画片《千秋诗颂》今晚开播

2024年2月27日
524
热点资讯
“海信新风空调 1晚多睡1小时”万店换新计划将启动

2025年5月13日
386
热点资讯
全球第三大手机系统鸿蒙4.0要来了

2023年7月24日
506
热点资讯
德施曼开启六大博物馆珍宝守护计划

2024年12月3日
427
热点资讯
魅族集团揭幕全新XR品牌“MYVU”

2023年11月27日
661
热点资讯
发那科智能工厂(三期)正式开业

2023年11月10日
507
热点资讯
教育部公示中小学人工智能教育基地名单

2024年1月11日
649
热点资讯
涂鸦智能用IoT塑造新式儿童成长环境

2023年7月26日
1.6K
热点资讯
苹果宣布韩国首尔 Apple Store 弘大店 1 月 20 日开业

2024年1月9日
528
热点资讯
中科大 2024 年少年班录取名单公布

2024年7月8日
647
热点资讯
公安部公布 10 起惩治网暴典型案例

2023年11月28日
587
热点资讯
比亚迪经营车险资质正式获批

2023年11月13日
639
热点资讯
复旦大学科学家取得纤维电池技术新突破

2024年4月26日
528
热点资讯
魅族宣布征集Flyme中文OS名称

2023年11月9日
807
热点资讯
谷歌推出新英语辅导工具

2023年10月20日
661
热点资讯
中国在全球高端家电市场话语权提升

2023年12月21日
526
热点资讯
华为100英寸至130英寸超大屏智能电视登场

2023年8月21日
863
热点资讯
陶哲轩成功用AI工具破解数学猜想

2023年12月7日
699
热点资讯
三星已拥有近 3 亿 SmartThings 智能家居用户

2023年10月8日
543
热点资讯
京东：618将把AI数字人直播技术免费开放给商家使用

2024年4月19日
798
热点资讯
奥迪推出新品牌LOGO

2024年11月12日
1.2K
热点资讯
《消费类电器测评标准智能开关》正式发布

2023年11月7日
861
热点资讯
华为自研仓颉编程语言官网和开发文档上线

2024年6月21日
708
热点资讯
小米集团成立科协、院士专家工作站

2023年9月12日
554
热点资讯
感受下中国先进农业

2023年11月30日
507
热点资讯
华为最强影像旗舰预定！P70系列主摄曝光

2023年11月23日
671
热点资讯
核辐射检测仪-5个月的库存1天抢光

2023年8月29日
1.4K
热点资讯
情感陪伴养老机器人“裴裴”亮相重庆

2025年3月21日
643
热点资讯
菜鸟宣布推出自营快递菜鸟速递主打半日达

2023年6月28日
517
热点资讯
宏碁全面布局 AI PC

2024年3月1日
500
热点资讯
思特威携多款重磅产品强势亮相2023 CPSE安博会

2023年11月1日
494
热点资讯
小米自研系统MIOS曝光

2023年10月10日
722
热点资讯
春运部分放空列车票价低至2折

2024年1月23日
573
热点资讯
仙工智能邀您相约 NEPCON China 2023

2023年7月17日
506
热点资讯
普渡大学发布Talk2Drive框架为自动驾驶助力

2024年2月27日
584
热点资讯
首个猫窝网潮体验店开业

2023年10月11日
617
热点资讯
全新固态钠电池问世：远优于钠离子电池

2023年12月25日
743
热点资讯
杭州亚运会电子竞技项目今日开赛

2023年9月25日
629
热点资讯
习近平主席出席中法企业家委员会第六次会议闭幕式，九号公司受邀参会

2024年5月10日
515
热点资讯
2025比利·简·金杯深圳总决赛抽签仪式圆满落幕

2025年5月19日
411
热点资讯
菲亚特微型纯电小车 Topolino 推出米奇特别版

2023年11月24日
600
热点资讯
华为非凡大师新Logo亮相

2023年10月24日
554
热点资讯
云端找回已删除的微信聊天记录

2023年6月29日
587
热点资讯
海尔智家三翼鸟携智慧场景和数字化体验亮相广州设计周

2023年12月8日
522
热点资讯
美光宣布推出32Gb DDR5内存芯片

2023年7月28日
612
热点资讯
一加官宣一加 Ace 3 将于1月4日发布

2023年12月27日
570
热点资讯
美团无人机首条高校外卖航线在深圳开航

2023年12月20日
553
热点资讯
津兴城际铁路明日（12 月 18 日）开通运营

2023年12月18日
530
热点资讯
乐橙持续深化智能安全Al能力

2023年11月21日
468
热点资讯
交通运输部：对5至7座汽车非法从事网约车经营进行精准打击

2023年9月26日
531
热点资讯
北京亦庄启动“参天计划”

2024年2月5日
694
热点资讯
2025北京智能康养机器人应用大赛在北京亦庄举办

2025年7月31日
246
热点资讯
中国铁路：近 1200 组复兴号高速列车投入运用

2024年1月22日
462
热点资讯
杭州加油站已进化到机器人加油

2023年12月6日
479
热点资讯
盒马拟于下周三恢复会员开通、续费服务

2024年4月18日
738
热点资讯
Matter 1.3 技术规范发布

2024年5月10日
927
热点资讯
英特尔携生态伙伴发布全新边缘AI方案

2025年6月26日
548
热点资讯
“非洲之王”传音手机上央视

2023年10月13日
562
热点资讯
华为nova 12系列入门版首曝

2023年12月11日
674
热点资讯
苹果12.9英寸巨屏iPad Air价格曝光

2024年2月28日
458
热点资讯
华为海思参加 AWE 2024 上海家电展，将带来全新“5+2”智能终端解决方案

2024年2月19日
540

返回顶部