2018-07-13

組み込み型一覧

Python

組み込み型
  + 数値型
  |  + 整数
  |  + 長整数
  |  + 浮動小数点
  |  + 複素数
  + シーケンス型
  |  + 文字列
  |  + ユニコード文字列
  |  + リスト
  |  + タプル
  + マップ型
  |  + 辞書(ディクショナリ)
  + ファイルオブジェクト

参考 http://www.python.ambitious-engineer.com/archives/128#i-3

2018-07-13

文字コード

IT雑学

文字コードみたいなのって意外に重要だったりすることが多い。

文字コード

文字コードとは、コンピュータ上で文字を利用する目的で各文字に割り当てられるバイト表現。

（符号化）文字集合と（文字）符号化形式

（符号化）文字集合：世界中の文字の集合
（文字）符号化形式：文字集合をコンピュータ上で表示する数値の振り方

文字集合は等しいが符号化方式だけが異なる場合と、それぞれ異なる文字集合を同じ符号化方式で扱う場合がある。

日本語の場合

日本語には JIS X 0208 というJIS企画の文字集合に対して、 ISO-2022-JP （JIS コード）・EUC-JP・Shift_JIS など複数の符号化方式が対応している。

Unicodeの場合

Unicodeは符号化文字集合。符号化形式はUTF-8やUTF-16など複数種類存在する。

UTF-8：ASCIIの上位互換。そのためASCII前提のプログラム(HTTP, SMTPなど)でも利用ができる。

Pythonの場合

私の環境（Mac上のPython3）ではデフォルトの文字コードがUTF-8になっていた。だからWindows上でコードを使い回す場合にはUTF-8の指定が必要だったのか。

Python2ではデフォルトの文字コードがASCIIのため日本語を利用するにはUTF-8の宣言が必要となる。

2018-07-11

Gitチェックアウトコマンド

Git

本当に今更なんだけど。。。チェックアウトコマンドには２通りの使い方がある。

ブランチの切り替え

複数ブランチ間の切り替えに用いる。

ワーキングツリーへのファイル展開

ワーキングツリーで編集したファイルを差し戻す場合に利用する。

# コミット「6f87gs1」のtest.pyを、ワーキングツリーに展開する場合
git checkout 6f87gs1 test.py

# HEADのtest.pyを、ワーキングツリーに展開する場合
git checkout HEAD test.py

# ステージングエリアのtest.pyを、ワーキングツリーに展開する場合
git checkout test.py

2018-07-06

クラス設計雑記

オブジェクト指向

最近スクリプト *1に機能追加してプログラム*2を作成する機会があった。

最初はなんとなく実装しながら必要に応じてクラスを追加していったが、途中からロジックをシンプルにするために、あちこちのクラスのメンバーの修正が発生してしまい、結局最初に書いたコードの３〜４割程度を書き直すこととなった。

原因はクラスが３つ程度ならばクラス設計なしでもいけるが*3、クラスが５つ以上になるとクラス設計がないと厳しいからだと思う。思うにクラス３つの場合、クラス間の通信は3C2=３通りであるが、クラス５つの場合クラス間の通信は5C2=１０通りとなる。流石に１０通りもあると最適な組み合わせを実装と並行して考えるのは難しい。

清書したようなクラス図はいらなくても、チラシの裏にでもER図やクラス図をざっくりとでも書いてみることが大切なのがわかった。

ちなみに当然なんだけどER図やクラス図は言語によらないがフレームワークは言語に依存する。そもそも両者はそれぞれ担当する範囲が違う。フレームワークを利用する時点である程度クラス設計は束縛されることとなる。

*1:単機能・比較的ロジックがシンプル・小規模・クラスなし

*2:多機能・それなりに複雑・中規模・クラスあり

*3:というかそもそも３つ程度ならクラスなしでも大丈夫かも