文章目录

最近写爬虫的时候遇到需要对文本内容进行对比计算相似度,找了很久还真的让我找到个现成的模块 python-Levenshtein 这个模块用法直接用help看吧,我主要用到里面的distance和ratio,其它的暂时还不知道有什么功能。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
"""
Levenshtein.apply_edit Levenshtein.median_improve
Levenshtein.distance Levenshtein.opcodes
Levenshtein.editops Levenshtein.quickmedian
Levenshtein.hamming Levenshtein.ratio
Levenshtein.inverse Levenshtein.seqratio
Levenshtein.jaro Levenshtein.setmedian
Levenshtein.jaro_winkler Levenshtein.setratio
Levenshtein.matching_blocks Levenshtein.subtract_edit
Levenshtein.median

>>> ratio('Hello world!', 'Holly grail!')
0.58333333333333337

>>> distance('Levenshtein', 'Lenvinsten')
4
"""
文章目录