パフォーマンス最適化は言語では決まらない。CPU実行とデータ構造で決まる

C言語をはじめ、プログラム言語についての議論では「どの言語が速いか」という観点に寄りがちです。ただ、実際の開発現場では、言語選択だけで性能が決まる場面は多くありません。

同じアルゴリズムであっても、実行時間に大きな差が出ることがあります。本記事では、その差がどこから生まれるのかを、アセンブラやデータ構造の観点から整理します。

CPUはアセンブラとデータ配置で動いている

プログラムは最終的にアセンブラに変換され、CPU命令として実行されます。CPUが処理しているのは、どの命令をどの順番で実行するかと、どのデータにどうアクセスするかです。

そのため、ソースコードの見た目や言語の違いよりも、生成される命令列とメモリ上のデータ配置が重要になります。ここに着目することで、性能の見え方が変わります。

速度差を生むのはキャッシュと分岐である

CPUの性能を引き出す上で重要なのは、メモリと分岐の扱いです。
データがメモリ上で連続して並んでいる場合、CPUはキャッシュを効率よく活用できます。一方で、離れた場所に散らばっていると、そのたびに読み込み待ちが発生します。
また、条件分岐が多く、かつ結果が予測しづらい場合、分岐予測が外れ、処理が止まる時間が増えます。これらはコードの見た目からは分かりにくい部分です。

AoSとSoAの選択が処理の流れを変える

データ構造の設計も性能に大きく影響します。代表的なのがAoSとSoAの選択です。
AoSはオブジェクト単位でデータをまとめる構造で、扱いやすさがあります。一方で、特定の要素だけを連続して処理する場合、メモリ上のアクセスが飛びやすくなります。
SoAは同じ種類のデータを配列として並べる構造で、連続アクセスになりやすく、キャッシュ効率が高くなる傾向があります。
この違いは、アセンブラレベルで見ると、メモリアクセスのパターンとして明確に現れます。

同じアルゴリズムでも結果が変わる理由

現場では、アルゴリズムが同じでも実行時間が変わるケースが頻繁に見られます。
たとえば、ループ内でランダムに近いメモリアクセスを行う実装と、連続アクセスになるように並べ替えた実装では、処理時間が大きく変わります。
また、分岐をその場で判断する構造と、あらかじめ分類してから処理する構造でも差が出ます。これらはすべて、CPUがどのように命令とデータを扱うかに起因します。

どこを見ると改善の方向が見えるか

最適化を検討する際は、コードの書き方ではなく、実行時の挙動を見ることが重要です。
どの処理でCPUが待たされているか、どのメモリアクセスが非効率になっているかを観察します。
アセンブラレベルで命令の流れを見る、データ配置が連続しているかを確認する、AoSとSoAのどちらが適しているかを検討する。こうした視点が改善の起点になります。