“按照格雷的观点,作为人工智能的法律专家系统首先在英美判例法国家出现的直接原因在于 ,浩如烟海的判例案卷如果没有计算机编纂、分类 、查询 ,这种法律制度简直就无法运转了。”[ Pamela N.Gray Brookfield, Artificial Legal Intelligence, VT :Dartmouth Publishing Co., 1997.p.402.]近年来,大数据、云计算以及深度学习成为人工智能不断发展、壮大并逐步渗透于诸多领域的重要推动力。比如,在法律领域中,“利用人工智能与大数据, 可以使法官得到类似案件的全部先例以及法律、法规、司法解释等裁判规则, 从而在减轻法官工作负累、促进法官准确适用法律以及保证类似案例、类似判决等方面, 发挥巨大作用。”[ 蒲晓磊:《法律该赋予人工智能怎样的地位》,载《中国人大》2018年第4期,第34页。]贵州省高院“以大数据挖掘分析为前提,建立类案裁判标准数据库,建立类案及关联案件强制检索机制,为法官提供多维度、多层面的分析场景,通过自动检索、类案推送、裁判文书语义分析、对比分析等大数据方法避免类案非类判现象。”[ 贵州省高级人民法院:《探索“类案类判”机制 确保法律适用统一》,载《人民法院报》2018 年 1 月 26 日。]重庆市江北区法院自2017年4月运行了金融案件“类案智能专审平台”,利用该平台“自动向法官推送相似度较高的案例,并对法官拟做出的裁判进行智能评析。”[ 刘政宁:《重庆法院打造类案智审平台 审理周期平均少27天》,载人民网:http://cq.people.com.cn/n2/2017/0831/c365401-30680297.html,2018年10月5日访问。]“利用大数据技术构建新型司法业务辅助模式,通过要素分割路径来解决人脑知识和记忆的有限性,代之以人工智能的检索能力来解放法官、检察官的脑力劳动。”
大数据是人工智能的营养供给,“一切人工智能都必须基于充分的大数据,有数据方有人工智能。”[ 左卫民:《关于法律人工智能在中国运用前景的若干思考》,载《清华法学》2018年第2期,第114页。]最高人民法院公布的指导性案例及其动态裁判文书中援引的指导性案例,为法官检索到相关指导性案例和先例提供了重要的数据来源。而大数据挖掘技术与大数据清洗技术又保障了数据来源的质量、可靠性及其实现数据迭代。[ 数据挖掘技术(data mining)就是从大量数据中寻找隐含在其中的规律的过程、方法和技术,又称数据库中的知识发现(KDD)。参见张效祥主编:《计算机科学技术百科全书》(第 2版),清华大学出版社 2005 年版,第 706 页。数据清洗(data cleaning, data cleansing 或者 data scrubbing)的目的是检测数据中存在的错误和不一致,剔除或者改正它们,这样就提高了数据的质量。Rahm, E., Do, H.H. Data cleaning: problems and current approaches. IEEE Data Engineering Bulletin, 2000,23(4):3~13.]在指导性案例的相似性判断中,人工智能中的算法及其所具备的深度学习能力,为人工智能应用于繁琐复杂的类似性判断和法律适用提供了重要的技术支持:“有学者指出,擅长法律推理的人工智能应当可以解决以下问题:根据案例的类比推理(包括真实案例和假设案例);根据规则推理;多种推理方式的结合;处理定义不严密及含义开放的概念;设计论证和解释;处理各项知识的例外和期间的冲突,比如规则间的冲突;包容法律知识基础的变化,尤其是法律概念的变化,处理非单一性因素引起的变化,即由于更多新知识的出现而使原有的真理不再成为真理,因之而起的变化;模拟普通常识;模拟人的意向和信念知识;承担理解自然语言的功能。”[ 於兴中:《法理学前沿》,北京:中国民主法制出版社,2014年,第102—105页。]深度学习能力使得人工智能处于不断的知识追踪、认知、评价、更新状态,为人工智能不断学习持续更新、多样化的指导性案例及其应对转型时期出现的复杂多变的新情况、新问题提供了必备条件。当事人获得人工智能依据数据输出的反馈,做出自己的行动决策,而决策本身也形成新的数据供人工智能进一步学习