ビジネス上の問題を把握する
あなたは、開業医による医療がさらに有意義なものとなるように支援することに焦点を当てた Proseware というスタートアップで働いているとします。 開業医の支援を目的に、医療情報に基づいて患者をより迅速に診断することができる新しい Web アプリケーションが開発されています。
糖尿病分類モデルは、トレーニング済みであり、Web アプリとのインテグレーションに対応しています。 Proseware の重要な長期目標は、将来にわたって、アプリとモデルの精度を向上させ続けることです。
あなたは、機械学習エンジニアとしてチームに参加しました。ここでは、モデルとアプリの継続的インテグレーションを標準化するように求められています。 標準化の重要な側面の 1 つに、モデルをトレーニングするために使用されるコードの検証があります。
糖尿病分類モデルのトレーニングに使用されるコードを検証するには、次を実行します。
- リンティング: Python または R スクリプトに含まれるプログラムまたはスタイルのエラーのチェック。
- 単体テスト: コードの内容のパフォーマンスの確認。
データ サイエンス チームでのコード品質標準の理解が進むように、Visual Studio Code でローカルで開発する際に、コードを検証できるようになります。
ただし、運用環境にプッシュされたすべてのコードが、問題なく、想定どおりに動作することを確認するために、コード検証を自動化する必要があります。 データ サイエンス チームと共に、GitHub Actions を使用して、pull request が作成されるたびにリンティングと単体テストを実行することに決定しました。