场景文字识别机器人

场景文字识别机器人

可识别图片中的印刷体中文文本信息。该机器人使用两个模型来完成身份证识别任务。模型一是Connectionist Text Proposal Network(CTPN)模型,图片经过CTPN后可以取出文字位置的坐标信息,之后,包含文字的图片被送入第二个名为Convolutional Recurrent Neural Network(CRNN)的模型去识别图片中文字的内容。

示例文件

  1. 场景文字识别的机器人的输入文件是中文文档的图片。
  2. 支持的文件格式是 jpg 或者 png
  3. 示例文件内容如下