Think Smart を読んだ
audiobookで50%オフセールになってたから買ってみた。チケットで購入できないからずっと欲しいものリストに入ってた。
Think Clearly は読んでいたからか、どこかで聞いたことがある話もあって、どこで聞いたんだろう?と気になった。
時間があれば特におもしろいと思ったところはメモしたいなー
SQLの絵本を読んだ
「判断するのが怖い」あなたへ 発達障害かもしれない人が働きやすくなる方法を読んだ
判断するのが怖いとは思ってないけれど、 audiobookで息抜きに聴いた。
発達障害の特性からの困りをそのままにしてたらずっと困っていることになってしまうので、知識と対策は必要だよなと思った。
フェイクを入れつつも実際にあった話では、「納期に遅れそう」って相手に言ったら、「大丈夫ですよ」と言われて、もうやらなくてよいと言われたと思って最後まで仕上げなかったとか、複数のタスクを平行して進めないといけないときに、「効率良くやってくれ」と上司に言われて、素早くやらないと行けないと思い気持ちだけ焦ってしまうとか。効率良くやるというのは、素早くやるではなくて無駄なことをせずに優先順位を付けて最短で仕上げるという意味だったりする。
ワーキングメモリが少ないと耳から情報を取得して処理するのが不得意だったりするけれど、だからといって文字で書いてあげてもうまくできないことが多いのだとか。耳で聞いて覚えられないなら、メモを取ったらよさそうだけど、メモを取るのも大変とのこと。会議で結論が出るまで二転三転した議論が流れが追えなかったりするらしい。前提知識もなくて、スキル不足だったりキャパオーバーのことを1回で理解してもらうのは難しいという当たり前のことに気づかされた。
イラストでそこそこわかるSQL SELECT文と並び替え・集約のきほんのきまで
やわらかそうな見た目の本からやってみようかなと思って先にこれを読んでみることにした
2021/08/10
- 0章はMySQLの設定だったので飛ばして、2章まで読んだ。理解しているところは読まなくてもよいかなと思いつつも、前の本には書いてなかったこともあるけれど、それはMySQLとの違いなのかはわからない。
- MySQLで使えるSQLなので、他データベースでは使えないものもあるから気をつけてとあったけれど、どうやって気をつけたらよいかがわからず不安になりつつ、そこそこわかればいいからあとで調べようと思った
- FROMの指定の仕方は先にBigQueryでのやり方を勉強しておいてよかった
- 比較演算子が前に読んでた本よりたくさんでてきたから差分があるのかをあとで調べる
- 文字列検索のときに使うBINARYも前の本ではでてきたっけな? →索引にはなかった
2021/08/11
- 3章と4章
- XOR とか NOT って使うのかな。
- AND は OR より優先される
- DISTINCT 重複してないデータ
- COUNT、SUM、MAX、MIN、AVGは集約関数(集計関数)
- SELECT句に定数を書くこともできる。レコードが複数あるときは全てのレコードに同じ定数が表示される
- GROUP BY 集約キー
- 先に書いた集約キーから順にグループ化していく
- WHEREとHAVINGのどちらを使うか
- WHERE句はグループ化を行う前のレコード全体に対する条件
- HAVING句はグループに対する条件
- FROM → WHERE → GROUP BY → HAVING → SELECT → DISTINCT の順に実行される
- 【感想】高校で勉強してたらすんなに身についただろうなと思った。パズルみたいなので、練習したら数学の計算問題みたいに流れるように書けそう。
2021/08/12
- 5章
- LIMIT に OFFSET も一緒に書くやり方があったけれど、2番目から3つが LIMIT 2,3 と書くからややこしい。直感的じゃないやつは覚えずに見た目がわかりやすい書き方でよさそう
- 【感想】2日連続3時に寝たから早めに切り上げようと思ったけれど1時半過ぎてる。これまで勉強したやつの復習なので前には進んでいない。
2021/08/13
- 6章と7章
- CASE IF COALESCES CAST
- サブクエリ
- 【感想】残り1章になった。エクセルも手書きの四則演算とSUMくらいしかできないからデータをいじるならできた方がよさそうだなと思ってきた。がんばってSQL書くより速いということがありそう。また2時過ぎてしまった。
2021/08/14
- 8章 テーブルの結合
- UNION 重複しているデータは除外される
- UNION ALL 重複させたいとき
- INNER JOIN → JOIN 重複しているものは除外
- LEFT OUTER JOIN → LEFT JOIN 重複
- RIGHT OUTER JOIN → RIGHT JOIN 重複
- CROSS JOIN すべてのレコードを組み合わせる
- ON a.id = b.id は USING (id) と書ける。USINGを使うときにはカッコが必要。カッコの中に書く。
- 【感想】5日で終わったのでまずまずというところかな。
集中演習 SQL入門 Google BigQueryではじめるビジネスデータ分析
ちょっとはわかってた方がよさそうと思ったので1冊読んで勉強してみることにした。
いつもは読み終わってから感想を書いているけれど、学習記録とメモを書きながらやってみる。
2021/08/01
- 3章までざーっと読んだら、3章の最後に演習問題が出てきたけれど、覚えるつもりでは読んでなかったので、3章を読み直すことにした。
- 3章の途中まで読み終わった。
- 【感想】レビューしてもらうにしても、そもそもの条件が間違っていたら、間違っている条件で正しく書けているかがチェックされてしまうことになるし、nullが混ざってて集計データが狂ったりもしそうだから、恐ろしいなと思った。200件程度のデータで目視でも確認ができる量のデータならいいけれど、何万件もあるデータで合っているかどうかをどうやって確認するんだろう。
2021/08/03
- 途中まで読んでいた3章を読み終わったので、演習問題をやった
- まあまあできたけれど、自分で書いてみると、日付を「"」で囲うのを忘れたりというのがあったりした
- 誕生日は昇順にすると年齢が高い順になる
- IN や LIKE はカッコ ( ) が必要
- 条件で抽出したいときは WHERE
- LIMIT 5 OFFSET 100 は101~105番。OFFSETを指定しないときが0と考えるとわかりやすいかも?
- 元のデータを見ながら、そこから出力されるデータをイメージしてから書くと書きやすい
- 【感想】自分で何も見ずに書けるようになるのを目指すのは大変なので、最初は目指さなくてよさそう。一通り学習して読める状態になればよさそう。
2021/08/04
- 4章(グループ化とデータの集計)をやった
- 演習用のサンプルデータが小規模なので、絞り込んだり、頻出順に並べたりするのは、スプレッドシートでやったらすぐできるのにと思いながらやっていた。
- データが大量にあってもBigQueryだと結果が返ってくるのが速いからメリットを感じられるそうな。たしかにスプレッドシートで処理するのにめちゃめちゃ時間がかかることがある。
- 【感想】書き方が複数あったり、省略できるものはレビューするのが大変そうだなと思った。
2021/08/05
- 5章 テーブルの集合まで。残り半分は明日やる
- 慣れるまでは図を書いてからじゃないとできなそう。いきなり頭の中で組み立てるのは無理そう。
- 同じものだったら最初にテーブル作る際にフィールド名を統一しておいた方がよさそうだけど、実際には統一されないことがあるのかな。同じものなのに違うフィールド名になっているときの書き方もわかったのはよかったけれど。
- 【感想】まだいきなりは書くことはできないけれど、こういうものがあるのだなということだけ覚えておいて、あとは実際に使うときに参照しながらできればよさそう。
2021/08/07
- 5章の続きでテーブルの集合演算と仮想テーブルの作成
- テーブルの結合よりはわかりやすかった。ここからずっと取っつきにくかったらどうしようと思ってたけど、よかった。他の本の目次を見るとテーブルの結合はあとの方に出てくるものもあった。
- 【感想】出したいデータは書き方は複数あったりしそうなので、数をこなして身につけるしかないんだろうなーとここまでやってきて思った。
- 図書館でやわらかそうなタイトルの本を借りてきて、パラパラ見てみたらよさそうなのでいったんここまでにして他の本を読んでからにしようかな。
8月10日~8月14日までは他の本を読んでた。
2021/08/17
- 6章 サブクエリの半分まで
- 書く順と実行順が違うから、先に定義されていないものがでてきたりするので混乱する。WITHで仮想テーブル作るやつでは、テーブルにないものがいきなり先に出てきてこれはなんだ?となったりする
2021/08/18
- 6章 サブクエリの残り半分を読んだ
- テーブルを縦持ちや横持ちにするのは理解するのがむずかしかった
- 商品をカテゴライズしたり、ある条件でフラグを立てるとかは実用的なのかもしれないけれど、どうやって組み立てるかを考えるのがむずかしい
2021/08/19
- 6章 サブクエリの演習問題を3問やった
- 問題18の FROM(カッコ)をカッコにするやつはよくわからなかったので、あとで戻って調べる。GROUP BY に2つのカラムを指定すると重複なしのレコードになる。重複といえばDISTINCTかと思ったけれど違った。DISTINCTでも書けるのかもしれないけれど。
- 6章の問題はまだ2個残っている
- 2時半になってしまったので寝る
2021/08/20
- 6章 サブクエリの演習問題のこり2問をやった
- 7章 いろいろな関数の途中まで
- MOD関数:余りを求める。2で割った余りが0のやつをまとめるとデータを半分に減らすことができたりする。
- RAND関数:ORDER BY RAND() でランダムに並び替えができる
- CONCAT関数(コンカティネート):連結できる。名前に様をつけたりできる。フィールドの値を連結することもできる
- SUBSTR関数:開始位置をマイナスで指定すると右端から数えた場所を指定できる
- INSTR関数とSUBSTR関数を組み合わせてURLのディレクトリを抜き出して別カラムに表示させる方法と、LENGTH関数とREPLACE関数を使ってアンケート回答に「満足」という文字列が何回でてきたかをカウントするやり方がおもしろかった
2021/08/21
- 7章 いろいろな関数の途中から最後の演習問題まで
- 正規表現、日付・時刻、統計集計
- ここらへんはサンプルがありそうだから自分で考えるよりコピペでやった方がよさそうと思った
2021/08/22
- 8章 ウィンドウ関数
- データ分析手法を知っていることが前提なので、ウィンドウ関数を使うなら、そちらも勉強しないとだめだなと思った
- 8章の演習問題はやってないけれど、今やっても勘でやっているという感じになりそうだからやらなかった
同じシリーズの本によさそうなタイトルの本があったから読んでみようかな。
あなたはあなたが使っている言葉でできている を読んだ
audiobook で聴いた。
暇つぶしに適当に検索して、タイトルから勝手に気の利いた言い方とかの本かなと想像していたけれど違っていた。
やってみなければわからないので、とにかくすぐやれ!というメッセージの本だった。
クリエイター必携 ネットの権利トラブル解決の極意を読んだ
- 画像を無断転載されて困っているならこれを読めば全部書いてあるのでよさそう
- 法テラスは収入制限があることを知らなかった
- 直リンクは著作権侵害にあたらないというところは詳しく調べてみたい
- 裁判所で傍聴したことがないので1回くらい入ってみようかなと思った