现在的位置:主页 > 综合新闻 >

大数据时代下,如何识别垃圾信息?(2)

来源:大数据 【在线投稿】 栏目:综合新闻 时间:2022-08-15

【作者】:网站采编
【关键词】:
【摘要】:基思·斯坦诺维奇说,伪科学的传播所造成的代价是巨大的。怎么在纷繁复杂的信息里面,去伪存真,帮助自己解读判断,需要我们有一定的思辨能力,去

基思·斯坦诺维奇说,伪科学的传播所造成的代价是巨大的。怎么在纷繁复杂的信息里面,去伪存真,帮助自己解读判断,需要我们有一定的思辨能力,去识别信息中的垃圾信息。

数据可视化可以降低看数据的难度,但是在数据以图表的方式呈现出来之后,我们也需要去关注一些细节。因为图表会给出一些诱导性的表达方式,影响我们判断。比如误导性坐标轴(misleading axes )。

但是这种安全感是以知识发展的停滞为代价的。比如我们常常沉迷的占星、星座解释、通灵术等。

(过度装饰 & 误导性坐标轴)图片来源于 B 站公开课程

(用嘴型来表达家庭的财务安全度)图片来源于 B 站公开课程

法官说,“当然,DNA 匹配概率是百万分之一。你的当事人是凶手无疑。”

图片来源于 B 站公开课程

(画个人形,读数反而变得很困难)图片来源于 B 站公开课程

还有一类经常被大家搞错的是,误把关联关系当作因果关系。

所以对于一个很低的 p 值,不要认为这事就肯定成立了。

(视觉注意力都被大汉堡和苏打水抢走了)图片来源于 B 站公开课程

这些不可证伪理论有着巨大心理吸引力,其奥秘在于它们解释一切的能力。预先知道无论发生什么,你都能理解它,不仅给你一种掌握知识的感觉,而且更重要的是,给你应对这个世界所需要的情绪上的安全感。

向飙说:“社会生活里有很多问题都是老问题,一定要把老问题吃透。不要制造新的词汇,没有太大的意思”。

图片来源于 B 站公开课程

图片来源于 B 站公开课程

《大数据时代,如何识别 bullshit》, social dilemma》2020 on Youtube, @圈圈 原创发布于人人都是产品经理。未经许可,禁止转载

短视频、短信息时代蒸蒸日上,改变了公众话语的内容和意义,政治、宗教、教育、体育、商业和任何其他公共领域的内容,都日渐以“短娱乐”的方式出现,并成为一种文化习惯。

看完之后,一脸问号,他在说啥?

“虽然对于整体样本来说,检错概率很低,为百万分之一。但是在判断为凶手的结果里,总共 5 个人,只有 1 个是真正的凶手,其他 4 个都是误判,只有 20% 的正确率。没有办法判断我当事人就是凶手。”

之前文章《如何正确读数和更优决策》,讲了一个关于缺失数据做决策的故事。赛车队成员需要决定是否要参与一场重要的比赛。依据之前的经验,24 场比赛中有 7 场汽车引擎出现故障,故障情况和天气温度之间的关系如下图:

只有当一个理论并不试图预知一切,而是做出具体的预测,提前告诉我们世界上会发生什么具体的事情时,该理论才会进步。

图片来源于《成长边界》

(非要用栅栏表达房屋价格,让人看不懂)图片来源于 B 站公开课程

导致两个变量之间产生误导性关联的第三变量,有时候很容易看出来。比如,冰淇淋卖得越多,溺水就越多。是因为吃冰淇淋的人很多,游泳的人也很多,所以溺水的人才很多。

图片来源于 B 站公开课程

以下图为例,作者给你看的图是这样的,我们会快速认为,yes 和 no 的比例是 5/5 开。但是细看我们会发现,这两个分类左边的 y 轴并不一样,根本不是 5/5 开的关系。

过度装饰的图被称作 data visulization ducks。ducks 原意是用在建筑领域指过度装饰的建筑。图表也是如此,好的图表不要过度装饰,过度装饰反而会失去了他本来想要表达的内容。因为 ducks 会阻碍信息的交流。

Steven Pink 说过:活着好过死亡,健康好过疾病,富足好过匮乏,自由好过胁迫,幸福好过苦难,知识好过迷信和无知。

但是这些容易传播的短视频、短信息,大量充斥着假话和谬论。

文章来源:《大数据》 网址: http://www.dsjzz.cn/zonghexinwen/2022/0815/3492.html

上一篇:华夏中证云计算与大数据主题ETF净值上涨1.87% 请
下一篇:地球大数据最新监测:亚洲象栖息地近20年丧失超

大数据投稿 | 大数据编辑部| 大数据版面费 | 大数据论文发表 | 大数据最新目录
Copyright © 2018 《大数据》杂志社 版权所有
投稿电话: 投稿邮箱: