Track A
14:50 - 15:15 (JST)
業務でONNXモデルを扱う機会があり最初はありものの実装そのまま使っていたのですが、パフォーマンス面で改善したい点が出てきたため内部実装も含めて調査することにしました。自社開発デバイス上などいろいろな環境で動かしたいモチベーションもあり、公式ONNX Runtimeおよびその他のOSSの推論ランタイムを含めて調べました。
公式ONNX RuntimeのRustバインディングのクレートや、Rustだけで実装されているものがあります。ONNXフォーマット自体はオープンであるものの、推論処理の仕方やサポートしている機能はエンジン/フレームワークによって差があります。以下の軸で比較したものを紹介します。
また、これらを踏まえ、自身の実装課題に取り組んだことについてもお話します。
Copyright © Rust.Tokyo 2024 all rights reserved.