当前位置:网站首页>银行联行号cnasp&查询(二)
银行联行号cnasp&查询(二)
2022-07-17 05:02:00 【dzl84394】
去爬一份联行号的数据,或者找对接的银行要一个(他们肯定有,要申请提数,只是版本他们更新了,不会通知咱们),这都可以,但是15w的数据,放数据库里面有几个问题
- 用户输入查询的关键字不规范,可能有简写,可能有错别字
- 需要分词
- 不规范带来一个问题,就是同义词
银行肯定不断新增的(可能也有不断关门的,这个就不清楚构造了),而且不同机构覆盖的银行是不一致的,比如票交所只认9w个(可以去官网下载),
其他机构承认的正式标准的,我也不晓得哪里有,呼吁人行或者金融办等官网提供下载
我的想法是用Elasticsearch
这个东西jar包麻烦,而且不同版本的语法可能不一致,需要注意
银行的总行名称抓出来进行分词
这个百十来个,应该也容易
同义词列出来
- 比如工行,工商银行,中国工商银行,中国工商银行股份有限公司 这都是同义词
- 总有漏网之鱼,尤其ocr识别出来很多莫名其妙的,能加同义词的再不发生歧义的情况下,要加上同义词
打标签
- 来源
- 是否是票交所等
- 国股,大商,城商,三农,村镇,财务公司,港澳台,外资
边栏推荐
- 删除快照出现:删除快照时出错: 字典问题
- 数据库与开源的未来
- Summary of black screen problems in unity UMP packaging
- itext修改pdf文字
- 项目组暑假总结02
- 【Lipschitz】基于matlab的Lipschitz李氏指数仿真
- Service end interface test - test point of interface test [Hangzhou multi tester] [Hangzhou multi tester _ Wang Sir]
- mysql8.026-- 视图(下)
- Efficient insertion of references in word with thousands of words and many pictures
- Demo analysis of sliding conflict external interception method
猜你喜欢

ThreadLocal线程安全示例及其原理
[论文精读]BERT

Usage scenarios and usage of judgment and rounding down in MySQL

Unity UMP打包黑屏问题总结
![Fudan micro fmql (domestic zynq) [PS of IAR bare metal development] - non byte aligned access](/img/e7/8349da2c240ac8f51524e5e51bd4d6.png)
Fudan micro fmql (domestic zynq) [PS of IAR bare metal development] - non byte aligned access

Wildfly: how to call EJBs from EJBs located in another application

Notes on Advanced Mathematics: selected exercises of Wu Yue

Only when the data analysis report is written in this way can we really understand the data

shardingproxy分库分表实战及同类产品对比

OLTP 负载性能优化实践
随机推荐
Simple UI funny text conversion Emoji expression wechat applet supports sentence word conversion_ Source code
Rearrange data according to date JS
Website online package APK system source code
UE plug-in electronicnodes 5.0.0/4.23-4.27
Codeforces Round #419 (Div. 1)B - Karen and Test
[Unity] Input. Index of gettouch[index]
NPM installation tutorial
PHP array_filter去空保留0,false
服务端接口测试-接口测试的测试点【杭州多测师】【杭州多测师_王sir】
npm安装教程
记录一次存储过程批量修改表结构
Notes on Advanced Mathematics: a conjecture about the Equivalent Infinitesimal Substitution
Efficient insertion of references in word with thousands of words and many pictures
删除快照出现:删除快照时出错: 字典问题
TiDB 性能优化概述
Kubernetes 的监控与告警
Warriors of the Visual Studio, Assemble! (Visual Studio的勇士们,汇编吧!) 原创 2009年07月12日 19:40:00 标签:汇编 /mic
Introduction to redis
Leetcode remove element
项目组暑假总结01