走进微软全球最大实验室,解锁2022年前沿技术方向( 三 )


走进微软全球最大实验室,解锁2022年前沿技术方向
文章图片
值得一提的是其中的SSS项目(数据抽取与标准化存储) , 由医药魔方与微软实验室共同推进 , 为了解决相关表格数据抽取和存储的难题 , 医药魔方团队在实验室工程师的建议下 , 采用了微软FormRecognizerWebAPI接口 , 对相关资料全文以及表格数据进行抽取试验 。 该接口主要是对PDF文件进行OCR识别 , 抽取出全文以及表格数据 。 经过测验 , 通过该接口测试的报告准确率提高到了90%以上 。
走进微软全球最大实验室,解锁2022年前沿技术方向
文章图片
图:经过抽取与标准化存储后的数据图表