Kaggle Titanicチュートリアルの次は?
ざっとコンペの内容を見てみたところ、おそらく以下2つはチュートリアルの次に実施するコンペとして良さそうです。コンペの概要説明にも新規向けというような説明がされていました。
- Tabular Playground Series
- Digit Recognizer
Dataサイズ比較
実際にコンペを実施するにあたりどの程度のデータサイズ(DLサイズ)のものを扱うことになるのか、他と比べてどうなのか見ておくべきかと思い確認しました(そもそも容量不足で扱えない等ありそうなので・・・)。
Tabular Playground Series が7.21MB、Digits Recognizer が128.13MB です(2022/8/13時点)。データサイズ的にはそれほどリソースが必要にならなさそうに見えます。Prize対象ではないようです。
ルールや制限
Taitanic チュートリアル実施時には制限などしっかり確認せずに進めたのでここでコンペのルールについて一度確認しておこうと思いました。全般的には以下のルールとなっているようです。もしWINNERになるようなことがあればそれなりにドキュメント整備や説明の機会を求められそうです。
共通ルール
- 1アカウント
- チーム外へのコード共有NG(フォーラム参加者に共有可の時はOK)
- チームマージはOK
- チームサイズ:5(コンペによって3など条件は異なる)
- submit制限(コンペによって3final submission や final submission制限がなかったりする)
- 5/day
- 2 final submission
- 実施期間
- コンペ毎に概要に記載されているが、無期限のものもある
COMPETITION-SPECIFICなルール、条件
- Prizeの条件など
- 勝者licenseについて
- Automated Machine Learning Tool (AMLT)を使う際の注意事項
COMPETITION RULE
PrizeやSwag, Knowledge のコンペには COMPETITION RULE が設けられている(Kudosのものには現時点ではCOMPETITION RULEの記載はなかったが、たまたまかもしれないので都度要確認)。Prize の場合は勝者には WINNERS OBLIGATIONS などがあり、ドキュメントの作成や説明を求められます。COMPETITION RULE は次の項目についての内容が記載されていました(一覧)。
- BINDING AGREEMENT.
- ELIGIBILITY.
- SPONSOR AND HOSTING PLATFORM.
- COMPETITION PERIOD.
- COMPETITION ENTRY.
- INDIVIDUALS AND TEAMS.
- COMPETITION DATA.
- SUBMISSION CODE REQUIREMENTS.
- DETERMINING WINNERS.
- Prize の場合:DERTEMINING WINNERS
- Swag、Knowledgeの場合:DETERMINING LEADERBOARD
- NOTIFICATION OF WINNERS & DISQUALIFICATION.
- WINNERS OBLIGATIONS.
- Prizeの場合のみ
- コードやモデルを提出
- 次のような内容のドキュメントや説明も求められる
- 手法について
- 重要な特徴量について
- 使用ツールについて
- 学習に必要な時間
- アンサンブルしたかどうか
- weightはどうしたか
- 最もワークした single classifier はあったか、それはどれか、single classifier のスコアは?
- 他competitor と何が違ったのか
- 詳細はこちらのブログに記載あり
www.kaggle.com
- PRIZES.
- Prizeの場合のみ
- TAXES.
- Prizeの場合のみ
- GENERAL CONDITIONS.
- PUBLICITY.
- PRIVACY.
- WARRANTY, INDEMNITY AND RELEASE.
- INTERNET.
- RIGHT TO CANCEL, MODIFY OR DISQUALIFY.
- NOT AN OFFER OF CONTRACT OF EMPLOYMENT.
- GOVERNING LAW.
以上