level5

第五类验证码

问题介绍

中文验证码，包含 4 个中文汉字和 9 个中文单字，有噪点干扰，文字有旋转形变，验证方法为要求用户从 9 个单字中从左到右按顺序选出验证码中的汉字，输出汉字编号。

问题分析

汉字匹配，仅需判断是否是同一个字，无需识别出具体是什么字
位置固定，直接切割

模型结构

彩图

黑白图

介绍

第五类验证码为汉字，要求进行相似度匹配并输出编号。使用度量学习中的Siamese Network。经过训练与测试算法优化，最终可达97.40%的测试集准确率。在该网络模型中，学习率为0.0001，使用ReLU作全连接层的激活函数，使用Sigmoid作输出层的激活函数。

文件目录介绍

python代码
- accuracy_calculate.py 用于计算模型准确率
- conf.py 路径配置
- generate_batch_data.py 生成孪生网络所需正负样本对
- generate_tfrecord.py 生成tfrecord
- model.py 模型定义
- train.py 训练代码
- util.py 包含一个csv读取函数
- test.py 测试代码
文件夹
- mappings 训练集标签/测试集标签/预测标签
- model 生成的模型
- logs TensorBoard日志文件
- tfrecord TFRecord文件目录
- image 数据集
  - train 训练集数据
  - test 测试集数据
  - cut 切割后的数据
  - denoise 降噪后的数据

快速开始

步骤一：数据放置

下载地址：百度网盘提取码：e6zy

从百度网盘下载第五类验证码数据，分别将训练集和测试集解压放置在：
- 训练集：image/train
- 测试集：image/test
步骤二：生成正负样本对
```
python generate_batch_data.py
```
步骤三：生成TFRecord
```
python generate_tfrecord.py
```
步骤四：训练
```
python train.py
```
步骤五：测试
```
python test.py
```
步骤六：计算准确率
```
python accuracy_calculate.py
```
额外：查看TensorBoard
```
tensorboard --logdir=logs
```

Name	Name	Last commit message	Last commit date
parent directory ..
logs	logs	level5 for final	Jun 5, 2018
mappings	mappings	level5 for final	Jun 5, 2018
model	model	level5 for final	Jun 5, 2018
README.md	README.md	Update README.md	Mar 28, 2019
accuracy_calculate.py	accuracy_calculate.py	reformat	Mar 28, 2019
conf.py	conf.py	reformat	Mar 28, 2019
generate_batch_data.py	generate_batch_data.py	修复了未自动建文件夹导致切割图像后保存失败的问题	Apr 12, 2019
generate_tfrecord.py	generate_tfrecord.py	reformat	Mar 28, 2019
model.py	model.py	reformat	Mar 28, 2019
test.py	test.py	reformat	Mar 28, 2019
train.py	train.py	reformat	Mar 28, 2019
util.py	util.py	第五类验证码	Apr 28, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Files

level5

level5

README.md

第五类验证码

问题介绍

问题分析

模型结构

彩图

黑白图

介绍

文件目录介绍

快速开始

Files

level5

Directory actions

More options

Directory actions

More options

Latest commit

History

level5

Folders and files

parent directory

README.md

第五类验证码

问题介绍

问题分析

模型结构

彩图

黑白图

介绍

文件目录介绍

快速开始