Google Research 推出 InkSight,AI 手写识别技术新突破

InkSight：AI 读取手写内容的新方法

11 月 5 日消息,Google Research 展示了一种使用人工智能读取手写内容的新方法,名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本,无需任何中间设备。传统的手写文字识别技术主要依赖于光学字符识别 (OCR),但这种方法在处理复杂背景、模糊不清或低光照条件下的手写文字时往往表现不佳。InkSight 则采用了不同的思路,通过模仿人类学习阅读的过程,即通过不断地重写文本,来学习整个单词的外观和含义。

InkSight 的优势与表现

InkSight 在处理复杂场景时表现更为出色,例如当照片光线昏暗、文本部分遮挡或背景干扰时,InkSight 能够更准确地识别手写文字。研究人员发现,人类能够阅读 InkSight 生成的文本描摹的准确率高达 87%,其中三分之二的描摹结果与真实手写几乎无法区分。

实用性与潜力

对于喜欢手写的人来说,InkSight 具有巨大的潜力。想象一下,只需将手写笔记拍摄照片,即可立即将其转换为可搜索的数字文本。对于那些字迹潦草的人来说,InkSight 可以将难以辨认的手写内容转化为清晰、准确的打印文本。

保护手写遗产的广阔前景

从更广阔的视角来看,这项技术对于破译和将几个世纪以来的手写文本转换为数字形式具有重要意义。即使对于那些数字化程度较低的语言,InkSight 也能帮助保护手写遗产,并为这些语言的数字化训练提供更多资源。

其他手写识别技术的对比

此外,亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。而 Goodnotes 等数字笔记应用也推出了手写识别和编辑功能,可以将手写文字转换为可编辑的数字文本。

总结

Google Research 推出的 InkSight 系统通过模仿人类学习阅读的过程,成功实现了高效、准确的手写识别。这项技术在复杂场景下表现出色,具有广泛的应用前景,不仅方便日常手写笔记的数字化,还为保护和数字化手写遗产提供了新的工具。InkSight 的推出标志着手写识别技术的又一重大突破,未来将进一步推动手写文字的数字化进程。