私が歌川です

@utgwkk が書いている

Goの特定のパッケージだけGitHub Actionsのジョブを分けてテストする

生きてると、テストがどんどん遅くなりがちです。実際にDBに接続するタイプのテストとか……。そしてそういう種類のテストに限って並列化しやすいように実装されていないこともありがちですよね。

GitHub Actionsを使っている場合*1、そのようなテストが複数ファイル・パッケージにわたる場合は独立したジョブでテストを走らせることでCIの高速化を見込むことができます。

ということで、特定のパッケージのテストだけ独立したジョブで走らせる・残りのパッケージのテストは単一のジョブで走らせる という仕組みを作りました。実物を見たほうが早いと思うので、以下のリポジトリを見てください。

github.com

鍵となるのは以下3つのファイルです。応用すればGoに限らずさまざまな言語のテストフレームワーク向けに使えるはず。

  • separated-test-pkgs.txt
  • separate-test-pkg.pl
  • .github/workflows/ci.yml

separated-test-pkgs.txt

このテキストファイルに、独立したランナーで走らせたいパッケージ名を1行1エントリで書きます。パッケージ名の形式は go list ./... コマンドで出力されるものに揃えてください。

separate-test-pkg.pl

いきなりPerlのコードが出てきましたね。PerlはGitHubが提供するGitHub Actionsのrunnerに入っている*2ので、おもむろに小さなスクリプトを書くのに便利です。順に読んでいきましょう。

use strict;
use warnings;
use JSON::PP qw(encode_json);

JSON::PPはPerl v5.13.9からコアモジュール*3になっているので、追加でモジュールをインストールする必要なく使えます。よかったですね。

# separated-test-pkgs.txt から、個別にテストを実行したいパッケージを取得する
my @separated_test_pkgs = do {
    open my $fh, '<', 'separated-test-pkgs.txt' or die $!;
    chomp (my @xs = <$fh>);
    close $fh;
    @xs;
};
# package名 => 個別にテストを実行したいなら true
my %is_separated_test_pkg = map { $_ => 1 } @separated_test_pkgs;

先述した separated-test-pkgs.txt ファイルから、個別にテストしたいパッケージの一覧を取得しています。 %is_separated_test_pkg 変数はあとで使います。

# このモジュール下のパッケージ一覧を取得する
my @all_pkgs = split "\n", `go list ./...`;

# 同時にテストを実行してよいパッケージのみを抽出する
my @independent_pkgs = grep { !$is_separated_test_pkg{$_} } @all_pkgs;

バッククォートで囲んだ文字列はシェルコマンドとして実行され、実行結果の文字列が入ります。 go list ./... コマンドの実行結果をsplitすることで、全パッケージ一覧を取得しています。

先ほど組み立てた %is_separated_test_pkg 変数を使って、個別にテストしなくてよいパッケージの一覧を抽出しています。

# JSON形式で出力する (フォーマットは __END__ 以下を参照)
my $outputs = [
    (
        map {
            +{
                name     => $_,
                packages => [$_],
            }
        } @separated_test_pkgs
    ),
    +{
        name     => 'Others',
        packages => [@independent_pkgs],
    },
];
print encode_json $outputs;
__END__
(省略)

GitHub Actions workflowのジョブのoutputとして使いやすいように、JSON形式で出力しています。{"name":"テストの名前","packages":[パッケージ一覧]} というオブジェクトの配列を作っています。

.github/workflows/ci.yml

name: CI
on:
  push:
    branches:
      - main
  pull_request:

jobs:
  prepare:
    name: Prepare
    runs-on: ubuntu-latest
    outputs:
      separated-pkgs: ${{ steps.separate.outputs.out }}
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-go@v4
        with:
          go-version-file: go.mod
      - id: separate
        run: echo "out=$(perl separate-test-pkg.pl)" >> $GITHUB_OUTPUT
  test:
    name: Test (${{ matrix.target.name }})
    needs:
      - prepare
    runs-on: ubuntu-latest
    strategy:
      fail-fast: false
      matrix:
        target: ${{ fromJSON(needs.prepare.outputs.separated-pkgs) }}
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-go@v4
        with:
          go-version-file: go.mod
      - run: go test -v ${{ join(matrix.target.packages, ' ') }}

prepareジョブで、どのテストを独立に実行するか・同時に実行するか を先述した separate-test-pkg.pl の出力によって決めています。

prepareジョブの出力を受けて、testジョブでは独立にテストを実行するパッケージのmatrixと、それ以外のパッケージのmatrixに分けてテストを走らせています。go test コマンドには複数のパッケージ名を渡せるので、これでテストを個別に実行できるわけですね。

fromJSONjoin はGitHub Actions workflowの組み込み関数です*4。 動的に組み立てたmatrixのフィールドは matrix.target オブジェクトから参照できます。

fail-fast には false を指定しておいて、1つのテストジョブがコケても他のジョブが即時終了しないようにしておくほうがよいでしょう。

実際に以上のworkflowをもとにCIを走らせると、以下の画像のようにジョブが分かれていることが確認できます。

gyazo.com

先行研究

gotesplit*5というツールを使うと、Goのテストを分割数を指定して独立したジョブとして走らせることができるようです。

songmu.jp

今回は、DBを使うテストだけ独立して実行する・DBを使わないテストは高速に終わるからまとめて実行する というふうに、分割の基準を自由に指定できるようにしたかったので、自前で仕組みを用意してみました。このような単位で分けておくと、DBを使うテストでだけDBの準備をするようにできるし、複数のパッケージのテストからDBにアクセスしても干渉しないようにできます*6

*1:他のCIランナーでもそうだろう

*2:具体的にプリインストールされているソフトウェアについてはactions/runner-imagesリポジトリにあるOSごとのドキュメントを参照すること

*3:Perl本体に同梱されるモジュールのこと

*4:Expressions - GitHub Docs

*5:名前がおしゃれ

*6:たまにTRUNCATE TABLEするテストとかがある

aws-sdk-go S3 PutObject MaxMessageLengthExceededエラー 何

tl;dr

PutObject のオプションの Bucket フィールドに空文字列を渡していませんか? 環境変数経由で設定する値がうまく渡っていない、などありませんか? もう一度点検してみましょう。

この記事はこれでおしまいです。検索しても全く情報が出てこなくてしばらく悩んでいたけど、しょうもない感じだった。以下はおまけです。

起こっていたこと

aws-sdk-goでS3にファイルをアップロードするクライアントを書いた。手元では動いたので開発環境にデプロイして動かしてみたらなんかエラーが出る。

operation error S3: PutObject, https response error StatusCode: 400, RequestID: (snip), HostID: (snip), api error MaxMessageLengthExceeded: Your request was too big.

MaxMessageLengthExceededと出ているけど、ファイルをアップロードするのになんか制限に引っかかったか? でもS3にそんなシビアな制限ないのでは?? と思って首をかしげていた。あんまり凝ったことはしてないS3クライアントの実装だし、サンプルコードと見比べても変なところはなさそうに見える。

世の中には1x1.pngという非常にいい画像ファイルがあるのでこれをアップロードしてみると、エラーメッセージが変わった。何???

operation error S3: PutObject, https response error StatusCode: 400, RequestID: (snip), HostID: (snip), api error MalformedXML: The XML you provided was not well-formed or did not validate against our published schema

この時点では全く心当たりがなくて*1、いろいろ試行錯誤してもよく分からない。情報が足りていないので、APIコールのログを吐くようにしてデプロイし直す。

解決編

手元と開発環境でのAPIコールのログが取れたので見比べる。よく見るとリクエストの発行先がおかしい。バケット名が入ってなくない??

  • 手元: /bucket-name/hoge.png?x-id=PutObject
  • 開発環境: /hoge.png?x-id=PutObject

ここまで見たところ全てが分かった。環境変数のセットを忘れてるじゃん……。

ということで、環境変数を入れて再度デプロイしたら直った。

必須の引数 (バケット名) にうっかり空文字列を渡してもAPIコール前にはエラーにならず、変なエンドポイントを叩いた結果見慣れないエラーが返ってくる、というのが難しいポイントだった。気をつけてください。APIクライアントのコンストラクタで必須な引数が空文字列だったらエラーを返す、みたいなことをするともうちょっとよかったのだろう。

*1:ここ伏線です

手を動かして初めて腑に落ちる側

「腑に落ちる」という概念がそもそもそういうものなのかは分からないけど。

ドキュメントや教科書を読んでも、それだけで頭の中で理論を組み合わせて議論するのがどうしても苦手で、手を動かすことによって初めて理解を得るタイプである。座学だけではどうにもならなくて実践がセットじゃないと定着しない。そういうものなのかもしれない。

うっすら興味があるぐらいでは学びを得られていない感じがしていて、必要になって学び、いろいろ実験することで理解が得られる。いくらかは経験という形で他の人に教えることもできるだろうけど、その域に達しているものはまだまだ少ない。

検討をするときに、ドキュメントや制約などを読んだ上での考察だけだと何も分からないまま突き進んでいるような気がしてしまう。実験をして初めて方針への自信が持てるようになる。けどこれはそういうものなのかもしれない。

書き起こしてみると当たり前のことしか言ってないような気がするけど、これは当たり前のことなのか? どうですか。

YAPC::Hiroshima 2024に参加した #yapcjapan

参加しました。前日祭や懇親会・アフターイベント・YAYAPCも含めて全て出席していました。

yapcjapan.org

どの発表もおもしろく、全てについて詳細に取り上げるには紙面 (紙じゃなくない??) が足りないので、ピックアップ形式にさせていただきます。

とほほのWWW入門

キーノートが本当によかったです。ちょうど生まれたぐらいの頃*1からずっとインターネットで発信を続けられていて、まさにアウトプットの祖といえるでしょう。好きだから継続しているという話だったけど、しかしあの情熱は「好き」だけでは説明がつかないのでは??

若者にじゃんじゃん来てほしい

よく言ってるのですが、YAPCは学生支援制度が整っていて、学生でも交通宿泊費を気にせずに参加できるようになっているんですよね*2。YAPC::Japan運営ブログの方にも、学生支援制度を活用してくれ!! という趣旨のブログ記事を寄稿させていただいたことがあります*3

学生支援制度で参加された学生の方 (名前を思い出せず恐縮です) とも少しお話ししたのですが、YAPCは名前にPerlを冠するカンファレンスだけど、Perlは実は書いたことなくても気軽に参加できます。「Perlコミュニティのカンファレンス」ぐらいに思ってもらうのがちょうどよさそう。今回は応募多数で抽選になったようですが*4、学生支援制度で参加された方にはぜひこの制度のことを知り合いにも広めてもらいたいですね。あとはYAPCの参加記を書いてほしい!!

学生の頃から、身の回りに id:Pasta-Kid:nna774 のような人がいたのでYAPCの学生支援制度に素早くリーチできていたけど、そうじゃない学生の方はどうやってこの制度を知ったのか、誰かこっそり教えてください。

廊下とか懇親会とか

廊下や懇親会で、久しぶりに会う人・初めましての人・インターネットでは見たことがあるという人といろいろ会話できてよかったです。オンラインカンファレンスの懇親会会場で発話するのってめちゃくちゃ緊張感があると思っていて、懇親会でおもしろそうな話をしている人のところにフラッと寄ってみたり、とほほさんに話しかけにいったり、実装の議論をしたりなど、これはオフラインじゃないと現状ここまでやるのは無理だよな〜と思っている次第です。

しかし毎日遅くまで飲んでいたので満身創痍!! こういう暮らしがいつまでできるかな??

熱量を浴びる

他のカンファレンスでもそうなんですが、YAPCに行くと、世の中にはまだまだ知らない世界があって問題が解かれているのだ、人々が日々取り組んでいるのだ、ということを実感できますね。自分も誰かの学びになるような発表をできるようにありたいです。

フィードバック

名札の裏にスタンプラリーの台紙があるのを気にせずにスタンプラリーを回っていたら、白いパーカー*5にスタンプの色が付いてしまった!! 来年以降はこちらの件についてご対応を検討いただけますと幸いです。

ところで、こういった要望みたいなのをお伝えする公式のフォームとかあるんですかね?

全てに感謝

運営スタップの皆様、当日お話しできた方、出張として交通宿泊費補助を出してくれた株式会社はてな*6様に森羅万象に感謝を申し上げます。来年のYAPCで会いましょう。

布団買った

www.nitori-net.jp

マットレスがヘタってきているので買い替えるか、ぐらいのモチベーションでレンタカーを出してもらってニトリまで行った結果、敷布団が新しくなったのであった。寝具3点セットの敷布団と比べると安定感が違う。大学に来てからずっと同じものを使っていたのだから、買い替えたらただちに質が上がるわけである。

あと枕も買った。

www.nitori-net.jp

寝具への投資は生活のかなりの部分に効いてくるのだろうと思う。パソコンを触らない日もあるだろうし、スマホを触る時間も日によっては変わるだろうけど、普通に暮らしていたら寝ない日というのは存在しない。ここまで生活に効いてくるmy new gearもなかなかない。

でかい店は、それ単体で遊園地のように振る舞う。