投稿元:
レビューを見る
Python 3.4に対応している。サードパーティ含めた
機能別に使えるライブラリを紹介する。
ただし機能が大きすぎるライブラリは除く。
1章 テキストの処理
1.1 一般的な文字列操作を行う
1.2 正規表現を扱う
省略
1.3 Unicodeデータベースへアクセスする
初めて聞いたライブラリ、半角カタカナ
全角英数字、ローマ数字、異体字をUnicodeの
文字に変換してくれる。
2章 数値の処理
2.1 基本的な数値計算を行う
2.2 固定少数型で計算を行う
2.3 疑似乱数を扱う
2.4 統計計算を行う
省略
3章 日付と時刻の処理
3.1 日付や時間を扱う
datetimeのなかにdate,time,datetime,timedeltaがある。
pythonのエポックは1970/1/1 00:00:00
3.2 時刻を扱う
省略
3.3 datetimeの強力な拡張モジュール
標準ライブラリでは機能不足なのかdateutilモジュールがある。
3.4 世界中のタイムゾーン情報を扱う
タイムゾーンを扱うのに便利なpytzがある。
4章 データ型とアルゴリズム
4.1 様々コンテナ型を扱う
便利なコンテナが揃っているCounter,ChainMap,defaultdict,OrderedDict,deque
4.2 ヒープキューを利用する
4.3 二分検索アルゴリズムを利用する
省略
4.4 数値の配列を効率よく扱う
listではなく単一の型のみの配列
5章 汎用OS ランタイムサービス
5.1 OSの機能を利用する
主にファイルシステムに関する情報
5.2 ストリームを扱う
StringIOなど
5.3 インタプリタに関わる情報を取得、操作
sys.argv,sys.path,sys.exit,sys.stdin,sys.stdout,sys.stderr
5.4 コマンドラインオプション、引数を扱う
省略
6章 ファイルとディレクトリへのアクセス
6.1 ファイルパスを操作する
6.2 ファイルパス操作を直観的に扱う
省略
6.3 一時的なファイルやディレクトリを生成する
tempファイルを作り不要となれば削除も自動で行ってくれる
6.4 ファイル名のマッチングとパスのパターン展開
globは大変便利
6.5 高レベルなファイル操作を行う
省略
7章 データ圧縮とアーカイブ
7.1 zkibでデータ圧縮する
7.2 gzip圧縮ファイルを扱う
7.3 bzip2圧縮ファイルを扱う
7.4 lzma圧縮ファイルを扱う
7.5 zipファイルを扱う
7.6 tarファイルを扱う
省略
8章 特定のデータフォーマットを扱う
8.1 csvファイルを扱う
ほぼpandasのread_csvでやっているので使ったことない
8.2 INIファイルを扱う
省略
8.3 YAMLを扱う
サードパーティ製
8.4 JSONを扱う
省略
8.5 Excelを扱う
サードパーティ製、openpyxl(excel2007以降のエクセル)
直接このモジュールを使うよりpandasのread_excelが便利
8.6 画像を扱う
ちょっとした画像はpillowが便利
9章 インターネット上のデータを扱う
9.1 URLをパースする
9.2 URLを開く
サードパーティ製のrequestsの使用を推奨
9.3 ヒューマンフレンドリなHTTPクライアント
requestsの説明
9.4 Base16,Base64などにエンコードする
9.5 電子メールのデータを処理する
省略
10章 HTML/XMLを扱う
10.1 XMLをパースする
10.2 XML/HTMLを高速かつ柔軟にパースする
10.3 使いやすいHTMLパーサーを利用する
サードパーティ製beautifulsoupの使い方
11章 テストとデバック
11.1 ドキュメント生成とオンラインヘルプシステム
pydoc
11.2 対話的な実行例をテストする
doctest
11.3 ユニットテストフレームワークを利用する
unittest
11.4 モックを利用してユニットテストを行う
11.5 対話的なデバッグを行う
pdb
11.6 コードの実行時間を計測する
timeit
11.7 高度なユニットテスト機能を利用する
サードパーティ製 pytest
11.8 スタックトレースを扱う
11.9 ログを出力する
便利
12章 暗号関連
12.1 さまざまな暗号化を取り扱う
pyCryptoの取り扱い、公開鍵のアルゴリズムも実装されている
12.2 SSHプロトコルを取り扱う
paramiko
13章 並列処理
13.1複数プロセスを生成して並列処理を行う
multiprocessing
13.2 サブプロセスを管理する
subprocess