前言
随着大数据和人工智能的发展,Python 也与多种科技领域深度绑定。
涵盖自动化测试、运维、爬虫、数据分析、机器学习、金融领域、后端开发、云计算、游戏开发等方向。
万丈高楼平地起,Python 生态的强大得益于成千上万个库的支持。无数优秀的轮子支撑着这座大厦,本文梳理并俯瞰整个 Python 宝库。
什么是库?
从代码角度讲:库是一堆类 (class) 和函数 (function) 的集合。
从应用角度讲:库类似生活中的工具箱,箱子里有很多做其他事情必不可少的工具。
例如,如果你想抓取某网站的数据或图片,就需要能处理相关底层网络连接的代码,而这些代码都已经被写好了,你只需要调用库里的函数或类,能够提高开发效率。
面对不同的情况,自然需要不同的工具箱,以下是 Python 常用库的分类整理。
一、数据处理
Chardet # 字符编码探测器,可以自动检测文本、网页、xml 的编码
colorama # 主要用来给文本添加各种颜色,并且非常简单易用
Prettytable # 主要用于在终端或浏览器端构建格式化的输出
difflib # Python 标准库,计算文本差异
Levenshtein # 快速计算字符串相似度
fuzzywuzzy # 字符串模糊匹配
esmre # 正则表达式的加速器
shortuuid # 一组简洁 URL/UUID 函数库
ftfy # Unicode 文本工具
unidecode # ascii 和 Unicode 文本转换函数
xpinyin # 将汉字转换为拼音的函数库
pangu.py # 调整对中日韩文字当中的字母、数字间距
pyfiglet # Python 写的 figlet 程序,使用字符组成 ASCII 艺术图片
uniout # 提取字符串中可读写的字符
awesome_slugify # 一个 Python slugify 库,用于处理 Unicode
python-slugify # 转换 Unicode 为 ASCII 内码的 slugify 函数库
unicode-slugify # 生成 unicode 内码,Django 的依赖包
ply # Python 版的 lex 和 yacc 的解析工具
phonenumbers # 解析电话号码,格式,存储和验证的国际电话号码
python-user-agents # 浏览器的用户代理(user-agents)的解析器
sqlparse # SQL 解析器
pygments # 一个通用的语法高亮工具
python-nameparser # 解析人名,分解为单独的成分
pyparsing # 通用解析器生成框架
tablib # 表格数据格式,包括 XLS、CSV,JSON,YAML
python-docx # docx 文档读取,查询和修改,微软 Word 2007 / 2008 的 docx 文件
xlwt/xlrd # 读写 Excel 格式的数据文件
xlsxwriter
xlwings
csvkit
marmir
pdfminer
pypdf2
Python-Markdown
Mistune
dateutil
arrow
chronyk
delorean
when.py
moment
pytz
BeautifulSoup
lxml
htmlparser
pyyaml
html5lib
pyquery
cssutils
MarkupSafe
xmltodict
xhtml2pdf
untangle


