如何有效的进行公司名称匹配

1. 背景及主要问题 项目需要把两个独立的系统通过公司名称的匹配来实现数据打通,其中一个系统的公司数有40万+,另一个系统中需要匹配的公司数3600+,如果直接通过SQL LIKE形式的方式来关联两个系统,发现只有1100多家公司名称可以匹配,如果剩余2500家左右的公司需要纯人工方式手动匹配,不仅工作量大而且效率低。 通过分析bad case发现公司名称难匹配的主要问题有以下两点: 1.1 公司简称形式多样 公司简称往往是人们根据习惯约定而成的,没有标准的形