栏目分类
你的位置:MKR 中文站 > Lord Of SOL中文网 >
数字化大数据已悄然席卷日常生活。就像望远镜和显微镜开启了科学的世界图景一样,大数据对社会实在的刻画与洞察正在带来一系列全新的知识乃至社会实在的构建,具体到个体,很多领域已经用大数据知识代替了自我知识。这样合理吗?看似“更可靠”的大数据画像应用中是否有认知不公呢?原文 :《大数据画像比我还了解我?》作者 |首都师范大学哲学系副教授 谭笑图片 |网络大数据画像是网络平台等利用数据挖掘等技术广泛收集用户在互联网上的痕迹所产生的海量数据,进行数据分析,得到数据之间的相关性,从而产生关于“我”的知识,并预测之后的行为。因此,关于“我”的知识存在自我知识和大数据知识两种形态。自我知识指的是我对于自己的身体、心灵状态的感知、记忆等得到的知识。如果大数据知识相比自我知识更为可靠、真实,即大数据比我自己更了解我自己,那么我们是不是应该相信大数据知识而不是自我知识?事实上,很多领域已经用大数据知识替代了自我知识,例如保险公司会根据大数据画像来评估“我”的健康风险,而不是我对身体状况和生活方式的自述来计算应付的保费。这样合理吗?尤其对“我”来说公平吗?对这个问题的分析,我们将引入认知不公的理论资源。认知不公:隐藏得更深的不公正形式当代美国哲学家米兰达·弗里克(Miranda Fricker)提出的认知不公概念(epistemic injustice)是20世纪以来最有影响力的哲学概念之一。它强调的是在传统分配性的社会不公正之外,还有隐藏得更深的不公正形式——主体作为一个认知者在认知能力上所遭遇的不公正。认知能力是形成一个全面的人、完整的人中核心的能力,对于主体认知能力的不恰当否定给主体带来的伤害也同样是对人的深层否定。认知不公既是伦理上的错待,又是认知上的错待,例如认为女生不擅长数学的刻板印象使得面试官在挑选与数学相关的岗位时更倾向于男性。认知不公是通过社会的集体想象所实施的隐性权力活动,在各种社会偏见和既定成见影响下,低估发言者的置信度,即产生证言不公正(testimonial injustice),或者没有合适的解释资源使得一些人能阐释自己独特的社会感受,即产生诠释不公正(hermeneutical injustice)。从弗里克的论述中可以看到她认为判断认知不公的核心要素在于:主体的认知能力被错待,即被低估或高估;这种错待造成了对主体深刻的认知伤害,并且通常会延伸到社会不公,不是偶然的认知错误或认知厄运。认知不公区别于其他的不公正形式,在于它不仅体现在认知活动之中,而且对认知价值有损害,例如证言不正义妨碍我们获得真相,诠释不正义妨碍更多事实的揭示和准确表达,因此妨害认知价值构成了认知不公现象题中应有之义。这也使得它似乎成为了判定是否存在认知不公的一个内核标准,简单来概括,即后果上构成对主体的认知伤害,从客观上损害认知价值。对这一标准构成的一种挑战便是:是不是存在不妨害认知价值的认知不公呢?统计二重身:另一个数字自我有法国学者指出大数据构造了另一个数字自我:统计二重身(Statistical doppelgangers)。统计二重身指的是大数据将我们在网络上的数据痕迹收集起来,构建了一个“我”在互联网上的形象,也就是另一个“我”。她们认为统计二重身的几方面属性使得认知不公不可避免。第一,统计二重身拥有一种看上去的“客观性”,使得它成为一个更加可靠的证言来源。人的记忆并不总是可靠,或者由于某些目的会有意或无意修改基于记忆的证言。然而大数据的基础是记录在互联网上的数据,具有某种“客观性”。“我”基于记忆的第一人称通道在大数据面前自动失去了权威,即当事者的证言可靠性受到了极大的质疑。第二,统计二重身这一在线形象不受数据主体的控制,它是与数据主体相疏离的存在。用户对于哪些信息会被收集并不了解。在收集完成之后,信息平台会根据自己的利益,例如吸引眼球、流量等目的来设计算法、筛选原始信息。这个处理过程对用户而言是不透明的,或者即使透明也因为其专业门槛而不能被理解的。大数据画像产生了另一个我无法掌握,甚至无法预知的自我。第三,统计二重身的存在使得人被异化成为纯粹的客体,其基本的主体身份被无视。例如,“我”在晚饭后在电脑上观看了一部影片这一行为,不是我基于自由意志的选择,而是变成了关于主体的数据流中的其中一个点,而数据流中包含着主体背后某种隐性的行为模式,大数据能够从统计层面发掘出这种行为模式。观看影片这一行为只不过是行为模式在该情境中的一种展现而已。这些理由都充分论述了第一个标准——大数据给主体带来了认知伤害,否定了他们的认知能力,但是并没有论及第二个标准——是否妨害了认知价值。当大数据给主体的画像与主体的自我知识之间存在竞争关系时,选择大数据提供的知识是否妨害认知价值?自我知识是否具有认知权威自我知识实际上是一个非常宽泛的概念,统称我对自我状态的认知,从直接的感知到更高阶的理知。不少哲学家主张自我知识相对于外部世界知识来说有特殊的认识论含义,例如以齐硕姆(Roderick Chisholm)为代表的哲学家主张自我知识是在认识论上特别可靠的知识或者在获取方式上是独一无二的。一个人对自己心智状态的知识是不可能错的,比如我知道此刻我有疼痛的感觉,这类知识是很可靠的。然而总体上,这些主张自我知识具有认识论优势的观点都受到了来自各方面的挑战。我们其实对自己不甚了解,尤其是在以下几种自我知识类型中:对于自己品格的判断,如“我是一个诚实的人”;对于自我情感的预测,如“我将为我朋友获奖而激动”;等等。不难想见,上述这些自我知识很大概率不为真。还有一类自我知识似乎处在理性的范畴之中,但却产生了错误的因果连接。这些自我知识并不拥有权威,关键原因之一在于人们经常会发生自我归因错误。自我归因错误并非偶然,大量心理学实验证明了这是一种常见的大脑机制。内省给出的解释很多情境下并不是我们做出判断的真实理由。由此可以看到,自我知识在很多类型下并不具有认识论上的权威。与此相对照,大数据在这些领域上反而有更可靠的知识产出。然而,从现实状况来看,统计二重身的广泛运用触动了基本的社会结构和生活模式,也从底层改换了知识来源和自我认知。这种转换从浅的方面来说,是我所提供的自我知识证词在社会制度层面上被大大降低了效力,从而降低了我作为认知主体的信心和社会参与度;从深的方面来说,它主动地取消了我们生活中的诸多权利,以独立于个体之外的知识的形态提前决定了个体生活轨迹。在这种对比下,“更可靠”的大数据画像应用中是否有认知不公呢?大数据:系统性地形成了认知不公虽然在认识论上自我知识并不总是具有优越地位,然而在非认识论领域有其独特性。人类具有批判理性,批判理性将基于理由为自我态度做出辩护,因此具有独特性。信念、希望领域的自我知识是自我构成的,以社会约定确立了其权威,以自我宣告方式进入社会责任网络。自我知识的独特性在于它不是一个被动的、等待被观察、被研究的对象,相反,它能够被有意识的我主动构成。在集体交流层面上,自我知识同时是一种“言语行为”,对自己的言说是一个社会人重要的权利。在社会交往中,我们告知他人自己的信念、欲望时,同样行使着宣告功能。这种宣告背后意味着我将为这些宣告承担一定的社会责任,它构成了社会关系中的“我”。安德森明确地指出了个人层面上交易型(transactional)的认知不公与社会层面上结构型(structural)认知不公之间的差别。这一区分非常有利于重新澄清大数据应用是否带来认知不公的问题。交易型认知不公指的是原本应得的置信度在某次知识交易中没有得到公平的置换。大数据比自我知识更可能提供真知时,它确实更值得信任,因此没有发生交易不对等,没有认知不公。而个人因为被打上“不可靠”的标签提前就被排除在证言提供者之外,无法参加知识交易的过程,所以没有交易型不公正的可能,却存在着严重的结构型不公正。从更宏观的社会结构层面来看,统计二重身挑战的是自我知识在社会约定中建立起来的独特性。统计二重身否定了个人理性的反思、重塑作用。大数据造成的认知不公就如同典型的结构型认知不公一样,提前将某一种知识来源不当地排除在外。典型的结构型认知不公发生在不同的人群之间,优势主流群体在认知能力和德性上更被认可,也拥有更丰富的解释资源,边缘群体则反之。边缘群体会由于长期以来的偏见而被制度化地排除在他们理应提供认知见解的活动之外。而统计二重身则由于其在一些知识领域中相对于自我知识的认识论优势,而被认定为一种更好、更“客观”的知识来源。一旦这种认识论地位被社会广泛接受,生物主体的身份标签即是不可靠知识来源,因而也就稳定地变成了边缘群体。在需要提供证词或阐释的时候,他们提前被排除在外。从这些理由上,它破坏了知识正义,不仅对个人的认知能力造成错待,而且在社会的知识来源结构上,系统性地形成了认知不公。文章为社会科学报“思想工坊”融媒体原创出品,原载于《社会科学报》第1897期第6版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。本期责编:王立尧