数字化服务不是与法治彻底冲突,就是频繁地与法治相抵触。我们如何肯定下一代“法律技术”系统不会对特定群体或个人带有偏见?律师需要掌握哪些技能才能正确评估数据驱动决策下的司法质量?
编者按:本文由「图普科技」编译自What do AI and blockchain mean for the rule of law?
多年来,企业家们一直都在关注着传统的法律程序,削减成本让他们眼前一亮,“简化”一词频繁出现在他们口中,但是在人工智能技术面前,早期的法律创新也黯然失色。人工智能具有变革性的潜力,而且人工智能算法已经在逐步融入到法律程序中——在这个过程中也许在改变法律本身的底线。
但是,如果决策是由离散数据集训练出的算法模型自动作出的,或者是通过嵌入区块链的执行策略而作出的,那么法律保护如何得到保障呢?
这些问题正是著名的法律学家和哲学家Mireille Hildebrandt将在一个五年项目中研究的问题。这个五年项目研究“计算机法律”的影响。“计算机法律”一词属于Hildebrandt首创,她是布鲁塞尔自由大学法律、科学、技术和社会研究小组的成员之一。
上个月,欧洲研究委员会资助了Hildebrandt 250万欧元进行双重技术的基础研究:人工智能法律智慧和区块链的法律应用。
接受TechCrunch采访时,她用“十分抽象也十分实际”来形容她的项目,她称该项目将同时吸纳律师和计算机科学家参加。她的目标是提出一种新的法律解释学,律师可借住这个框架处理计算机法律架构,了解其局限和作用,能够提出正确的问题以评估那些不断被用来评估人类的技术。
她解释道:
我的想法是律师和计算机科学家合作理解他们所面临的问题,希望律师可以思维敏捷、擅长分析且与计算机科学家坦然相处,真正理解彼此的语言。
我们并不打算去开发一种新的通用语言。这也是行不通的,我坚信这一点。但是他们必须能够理解一个术语在对方学科的含义,学会沟通和妥协,他们必须看到两个领域的复杂性,不要将事情简单化。
在了解其复杂性后,能够向相关的人,即我们这些民众——阐释,使得民众能够在政治和日常生活中作出正确的决定。
Hildebrandt表示,她把人工智能和区块链技术纳入项目内容,是因为二者提供了“两种不同类型的计算机法律”。
当然也有可能将二者结合起来应用——在法律技术背景下创造出“全新的风险和机遇”。
Hildebrandt认为区块链“冻结了未来”,这也从侧面承认了在法律背景下,比起AI,她对区块链技术更加持有怀疑态度。
一旦你将想法置于区块链中,任何改变都是非常困难的。因为当这些规则自我强化后,如果你想做出任何改变,那么你不仅将在金钱、努力、时间方面付出高昂的代价,同时不确定性和混乱出现的几率也会增加。
你可以大把花钱,但是当政府参与时,事情就不一样了,因为他们不可能只是花钱。
尽管如此,但她也认定在未来的某个时刻,区块链会成为一个极好的替代机制,例如,帮助各州和公司选定一个不太复杂的方法来确定全球税法规定的义务。(假设可以达成任何此类协议。)
鉴于互联网平台在跨国开展业务和与管理不同管辖区域和政治期望时产生的法律合规问题的复杂性,在未来某个时刻,可能需要新的应用规则系统,且将策略导入区块链可能成为解决所有交叉混乱的一种重要方式。
但是,Hildebrandt对基于区块链的法律合规体系这一构想仍持谨慎态度。
该项目的另一个研究领域是人工智能法律智慧,她清楚地了解其巨大的潜力,当然也存在有风险。
“人工智能法律智慧意味着你可以使用机器学习来进行论辩挖掘——即对大量的法律文本进行自然语言处理,并试图总结论述。”她举了个判断涉案人员是承包商还是员工的例子来解释说明。
“在美国和加拿大,这对公司和员工都会产生巨大的影响,如果他们弄错了,税务局可能会直接走进来给他们开一笔巨额罚金,还会追回大量金钱,这可能超出他们的承受能力。”
由于该地区的判例法十分混乱,多伦多大学的学者开发了一种AI——通过挖掘大量相关法律文本归纳出特定情况下的一系列特点,用于检查涉案人员是否是员工。
“简单来说,他们在寻找一种数学函数,能将输入数据(大量法律文本)以及输出数据关联起来。在这种情况下,无论您是员工还是承包商,都可以轻易辨识。如果这个数学函数在数据集中始终或几乎始终都正确,则称之为高精度,我们将使用新的数据或分离的数据进行测试,验证它是否仍然准确。”
鉴于人工智能依赖数据集来推导算法模型自动作出主观法律判断,律师将需要了解如何处理和检查这些技术结构以确定AI是否合法。
有误差的数据集不可能会形成高精度的数学函数。如果你的AI参与了对人进行主观法律判断,那么高精度的数学函数就不是一件可有可无的事了,而是必须。
“将要使用的技术或正在投资的法律技术都需要律师对最终结果进行解释——因此,不要说‘哇,这有98%的准确性,简直比最好的律师还棒!’ 他们应该说‘啊,好吧,能让我看一组测试后的性能指标吗? 嗯,谢谢,你为什么不使用这四个指标,是因为它们的准确度低吗?……你能给我看一下你的数据集吗? 你的假想是怎么设定的? 你为什么要过滤这些论点?’
律师必须要对这样的对话感兴趣,并从中找到乐趣。这是一个非常严肃的事情,因为法律判决对人们的生活有很大的影响,但关键在于,律师应该从在法律中解释人工智能的结果中获得乐趣。他们应该有能力谈论自执行代码的局限性——因为这也是项目的另一研究重点,即区块链技术的法律应用。
当谈及‘不可变性’时,可以说不可变性意味着如果将所有内容都放入区块链之后,突然发现这是一个可自动执行的错误,你将要花费大量的金钱和精力来修复,或者是谈论‘不可靠’时,你会说我们不应该相信这些机构,但我们应该相信我们不了解的软件,我们应该信任各种中间人,也就是在其他类型的分布式分类帐中无许可的挖掘工,或者其他类型的中间商。
我希望律师能够从中获得有力的证据,找到切实的论辩,真正理解机器学习的偏见所带来的影响和后果”
她接着举例说明了纽约大学AI Now研究所正在进行的研究,并据此来研究人工智能系统的影响和处理。
“这是一方面的问题,但我认为还存在更多的问题”,她在谈论算法歧视时补充道。 “所以这个项目的目的是让大家一起沟通合作,去理解这一点。
“我认为这对于律师来说非常重要,他们不需要成为计算机科学家或统计学家,而是要真正理解法律领域内正在发生的变革,然后才能分享,为面向文本的法律方法做出贡献。
我的研究全是围绕着文本进行的,但是当我们有能力使用非文本法规时,我们必须也要做好准备。实际上,我认为这已经脱离了法律的范畴。
那么,如何平衡我们真正理解的事情——文本,和律师并不理解的其他方法?......而且公民也不理解这些方法。”
希尔德布兰特认为使用人工智能法律智慧技术挖掘论辩将会被“善意利用”—— 例如,AI可以用于评估特定法院作出的判决的质量。
尽管如此,她提醒说,任何此类系统的设计都需要经过深思熟虑。
“一种愚蠢的做法是仅给算法提供大量的数据进行训练,然后说‘嘿,那是不公平的,哇,这是不允许的’。 但你也可以郑重考虑所需要的向量,以及如何进行标注。
然后你可能会发现,比如说,该法院的判决要严格得多,因为警方提交法庭的案件一定不会简单,但警察都是善意的,他们经常与公民交谈,所以如果公民犯的事没有那么严重,他们会试着用另一种方式解决问题,而不是诉诸法律。
因此,该法庭审理的案件都十分严重,因此相比其他接受所有警察或检察官提交案件的法庭,该法院判处的刑罚要重得多。
要理解这些,仅仅看法律文本当然是不够的。你还得了解警方数据。如果不这样做,就算你的准确性很高,得到的也是完全无意义的结果,因为它并不会告诉你任何你所不知道的事情。但如果你以另一种方式来处理,你将面对带有各种偏见的人们,并从挑战中获得乐趣。
然而,这种处理方式不应将太多的事情视为理所应当。
我的想法是,这个工作的唯一方法就是在系统的设计阶段将许多不同的人聚集在一起,无论是当你决定要根据哪些数据来训练时时,或是正在开发机器学习者所谓的“假设空间”时,或是试图建模时。 当然,你应该测试5个、6个,甚至7个性能指标。
这也是人们应该谈论的内容——不仅仅是数据科学家和律师,还包括公民,因为我们对法律问题的处理将影响公民生活。
而且我绝对相信,如果你能采取更巧妙地方式,那么你可以获得更强大的应用程序。但这样做的激励机制可能并不明显。 因为我认为法律技术可以被用于降低成本。”
她表示,该研究项目的关键概念之一是法律保护机制设计——探讨其他有趣的(而非令人担忧的)问题,比如 ‘犯罪前’检测由AI进行驱动,无罪推定会发生什么变化?
“如何设计这些系统,以使他们在上市的第一时间就能够提供法律保护,而不是对原有的进行补充。当然这不仅仅涉及到数据保护,同时关系到非歧视原则和特定消费者权益”,她说。
“我一直相信,无罪推定与法律保护机制设计息息相关。因此,这需更多的考虑警方和情报部门。如何帮助情报部门和警方购买或开发具有某些局限的信息与通信技术(ICT),使其遵从无罪推定原则。但这并不是一件容易的事,我们可能不得不重新设定无罪推定的判定标准。”
这项研究虽比较抽象,但却十分必要。Hildebrandt指出,人工智能和区块链这两大正在研究的技术,已经应用于法律语境中,尽管仍处于“试验状态”。
而且,技术推动的法律在未来必须无差别推进,否则风险很大。
“欧盟和各国政府热衷于试验......但试验在哪些方面已经停止,或系统在哪些方面已经应用,并影响了与你我生活息息相关的决策,这些并不是那么容易被发现的,”她补充道。
此外,她希望,该项目能够提出一种法律解释方法,帮助律师和律师事务所驾驭可作为其推销亮点之一的法律技术。
“很显然,市场上将会出现很多滥竽充数的法律技术。”她说,“这是不可避免的,法律技术将成为一个竞争性的市场,里面有好的有坏的,但要准确区分并不容易。因此,我相信通过这个基础性项目的研究,你将更容易找到两者的不同,并做出正确的判断。这关乎一种思维模式,一种了解这些事情重要性后的思维模式。
“我个人十分认同敏捷和精益计算。不要做毫无意义的事情,所以我希望这会为人们带来优势,帮助他们跳过一些荒谬的方法论,从而脱颖而出。”
【钛媒体作者介绍:本文由「图普科技」编译,微信公众号:tuputech,体验基于深度学习的「图像识别」应用】