Active Storage で XML の Content-Type が application/octet-stream になるのを防ぐ #rails

問題

Rails から Active Storage で S3 に XML をアップロードし、CloudFront でホスティングしようとしていた(XMLRSS フィードのようなもの)。

ファイルはアップロードされ、CloudFront 経由でアクセスもできたのだが、ブラウザだとダウンロードされてしまい表示ができなかった。

原因

S3 で当該 XML のプロパティを確認したところ、メタデータがおかしくなっていた。

Content-Dispositionattachment が設定されてしまっており、そのためブラウザでダウンロードになってしまっている。

また Content-Typeapplication/xml を指定しているにも関わらず、application/octet-stream になっていた。

データ( active_storage_blobs )の content_type や S3 でのオブジェクトタイプは問題なかった。

my_model.attach(  
  io: f,  
  filename: 'feed.xml',  
  content_type: 'application/xml',  
  key: 'feed.xml'  
)

対応

Rails の設定を変更することで解決した。

config.active_storage.content_types_to_serve_as_binary

content_types_to_serve_as_binary に設定されている Content-Type は、常に attachement として扱われてしまう。

デフォルトで text/xmlapplication/xml が含まれているので、外してやる必要がある。

config.active_storage.content_types_allowed_inline

content_types_allowed_inline は Active Storageでインライン配信を許可する Content-Type を設定するものだが、application/xml を含めておくようにしないと S3 上でのメタデータも意図したようにならない。

デフォルト値に追加しておくとよい。

# application/xml を削除
config.active_storage.content_types_to_serve_as_binary = %w(text/html image/svg+xml application/postscript application/x-shockwave-flash text/xml application/xhtml+xml application/mathml+xml text/cache-manifest)
# application/xml を追加
config.active_storage.content_types_allowed_inline = %w(image/webp image/avif image/png image/gif image/jpeg image/tiff image/vnd.adobe.photoshop image/vnd.microsoft.icon application/pdf application/xml)

まとめ

設定を変更することで、問題なく表示されるようになった。

一律でなくファイルによって個別に対応する必要があるような場合は、都度設定を切り替えるようにすればできそう(調べていない)。

参考

MySQL でクエリ単位のタイムアウトを仕込む #mysql

やりたいこと

MySQL で重い可能性があるクエリを投げるときに、一定時間以上かかったら、タイムアウトとしてキャンセル用にしたい。

解決策

MySQL のシステム変数でタイムアウト関連の設定をいじるという手もあるが、max_execution_timeオプティマイザヒント句に埋め込むことで簡単にクエリ単位で動作させられる。

SELECT /*+ MAX_EXECUTION_TIME(1000) */
    *  
FROM hoge_table;

max_execution_time はミリ秒単位の数字で設定できる。

実行時間が超えてしまった場合には下記のようなエラーが返ってくる。

Error running query: Query execution was interrupted, maximum statement execution time exceeded

手軽に使えるので、とりあえず検証用とかでクエリを流したい場合なんかに活用できそう。

参考

gihyo.jp

Rails + MySQL で半角全角区別なく検索したい #rails #mysql

問題

文字列のあるカラムに対して、半角全角や大文字小文字を区別なく検索したい場合がある。

(例) ABC で検索した場合に、ABCabc もヒットしてほしい

COLLATION を使う

MySQL の場合、照合順序(COLLATION)の設定で実現できる。

charset が utf8mb4 の場合、utf8mb4_unicode_ci を使う。

COLLATION 大文字小文字 半角全角
utf8mb4_general_ci 区別しない 区別する
utf8mb4_unicode_ci 区別しない 区別しない
utf8mb4_bin 区別する 区別する

COLLATE 句を使う

テーブルやカラムに対しても設定できるが、 COLLATE 句を使うことで、SQL レベルで照合順序を上書きすることが可能。

これにより影響範囲を局所的にできる。

SELECT *  
FROM  
    sample  
WHERE 
    -- WHERE で COLLATE を指定する
    name LIKE '%Alice%' COLLATE utf8mb4_unicode_ci;

Rails で使う

Ruby On Rails で使う場合、 scope を用意してあげればよさそう。

scope :fuzzy_matching_by_name, ->(name:) { where('name LIKE ? COLLATE utf8mb4_unicode_ci', "%#{sanitize_sql_like(name)}%") }

参考

「ゼロから始めるプロダクトマネジメント」を読んだ

プロダクト開発がどんなものなのかを分かりやすく説明していた。

自分はプロダクトマネージャーではなくプログラマの仕事だけれど、プロダクトマネジメントには意識的であれ無意識的であれ関わっているわけで、「自分たちがどういう仕事をしているのか」というのを再確認することができたかもしれない。

プログラマという職種的にはよりテクノロジーの具体や詳細、あるいはチーム運営みたいなものも重要な変数としては存在するんだけれども、シンプルな骨格を改めて認識するいい機会になったと思う。

new_framework_defaults_7_1.rb で NameError が発生する #rails

問題

Rails 7.0 から 7.1 にアップグレードしたので、7.1 のデフォルト設定を有効化しようとしていたら new_framework_defaults_7_1.rb でエラーが発生した。

エラー内容

action_view.sanitizer_vendoraction_text.sanitizer_vendor で使用している Rails::HTMLuninitialized constant になってしまう。

NameError: uninitialized constant Rails::HTML (NameError)

Rails.application.config.action_view.sanitizer_vendor = Rails::HTML::Sanitizer.best_supported_vendor

原因

Rails の Issue になってた。

sprockets-rails を使用していない場合、 rails-html-sanitizer を require する必要が発生していた。

github.com

対応

すでに修正 PR がマージ済なので、対応版のリリースを待つ。

「GitLabに学ぶ 世界最先端のリモート組織のつくりかた」を読んだ

少し話題になっていて気にはなっていたのだが、社内で輪読会が開催されることをきっかけに読んでみた。

GitLabという実例

GitLabという実例を元に、背景にある考え方を大事にしながら制度や仕組みを紹介している。

個性的な仕組みや制度も多く、興味深かった。

もう少し詳しく知りたいな〜、と思うところがちょこちょこあったけれど、あくまで一企業の例でしかないことを考えると、抽象と具体のバランスがよかったといえるのかもしれない。

本を読みながら改めて感じたけれど、リモート制度に限らず真似すればうまくいくというものではないと思うので。

印象に残った点

良し悪しはおいておくと、GitLab は仕事のパフォーマンスに一人ひとりのプライベートや内部的な価値観が大きく影響するという考え方があると感じた。

今の自分の環境

自分は基本リモート勤務しており、この一年間でも数回程度しか出社していない。 ただ全社的には出社を前提とする職種もある。

とはいえ、実は今のところリモート環境下における強い課題を自分自身は感じていない。 (より優先順位の高い課題に隠されている可能性はある)

なので、この本がめちゃくちゃ刺さったかというとそうではないんだけれど、難しいなと思うのは、状況が変わると働き方の課題の大きさや優先順位は随時変わっていくだろうなということ。

変数としては組織の拡大・縮小(人数の増減)が大きいだろうけど、体制やプロダクト・事業のフェーズも影響してくると思う。

そんなときにこの本を読んだことがヒントになるかもしれない。

おまけ

ちょうど輪読会の時期にタイムリーに、元GitLabの人の記事が話題になっていた。

t2y.hatenablog.jp

ZIPCODA API を使って、郵便番号の逆引きをした

概要

住所の一覧から郵便番号をまとめて逆引きしたかったので、 ZIPCODA API を使って実現してみた。

CSV ファイルから住所を読み込んで、結果も同じく CSV ファイルに書き込むだけ。

github.com

ZIPCODA を使った理由

たぶんサービス等で定常的に利用するなら ケンオール あたりを使うのがいいんだろうけど、一時的な利用だとオーバースペック感があったので、別のを探していたら見つけた。

API はシンプルで使いやすいと思う。

zipcoda.net

補足

最初は GAS で雑に済ませようと思ったけれど、 GAS からのアクセスは制限されているようだったので、プログラムを書いた。

API の過剰な呼び出しを防ぐように wait するようにしているおり、結果として処理は全部同期的に行うような形になった。

API の結果を住所単位でキャッシュするようにはしているけど、実際に役立つのは繰り返し実行したりするときくらいだと思う。