make7月9日5 分Amazon Redshiftのクエリがなぜかたまに遅くなる原因始めに 弊社では、膨大なデータの夜間バッチ処理にRedshiftを採用しています。 適材適所でサービスを選択しており、夜間以外はお役御免で停止しておき、費用面を抑えるよう工夫しています。 メンテナンスウィンドウも設けて運用していて概ね問題なく稼働しています。...
toshiki nishio5月22日2 分QuickSightでユーザ公開中データセットの参照元テーブルに列を追加する時の手順はじめに Quicksightでユーザに公開中のデータセットの参照元テーブルに列を追加することがありました。その時の手順についてまとめたいと思います。 列追加する時の考慮事項 更新対象のテーブルはユーザーが参照しているテーブルのため、ダウンタイムなしで項目追加後のテーブルに...
toshiki nishio2月2日4 分S3上のcsvファイルをデータソースとしてGlue Data catalogを作った時にハマったポイントはじめに S3ファイルをデータソースとして Glue Data catalogを作った時のハマりポイントを共有します。その前にGlueとはなんぞやといったことから紹介していきます。 Glueとは? 抽出(Extract)、変換(Transform)、ロード(Load)(略称...
a k2023年12月29日2 分Redshiftとソートキーはじめに Redshiftのソートキーはすっごく重要です。 最速JOINはマージJOIN Group byでもソートキーが使用される WHEREでレコードを絞り込むときにも有効 どの場合もソートキーの項目順をちゃんと合わせてないといけません。特に夜間バッチでよく使われる全件...