Set-VSE

集合型視覚言語埋め込み ※本リポジトリは動作未チェックです。うまく動かない場合はIssueを立ててください。

使い方

インストール

Dockerの環境を構築

git clone https://github.com/ahclab/Set-VSE.git
cd Set-VSE/env
bash build.sh

Dockerの起動

bash run_docker.sh

実験の実行

experiment_VSE.py: CLIPによる従来のVSEの実験を実行
experiment_set_of_VSE.py: Set-VSEの実験を実行
experiment_set_of_VSE_complete_sentence.py: オリジナルの説明文を文単位で分割したSet-VSEの実験を実行

実行例

run_NL_experiments.shを参照

オプションの説明

--IPOT：最適輸送を使う
--img_type：画像の条件
- global：大域埋め込み
- partial：部分埋め込み
- hybrid：大域＋部分埋め込み
--text_type：テキストの条件
- global：大域埋め込み
- partial：部分埋め込み
- hybrid：大域＋部分埋め込み

書誌情報 (for Citation)

品川政太朗, 中村哲. 集合型視覚言語埋め込み.  
第259回自然言語処理研究発表会, 2024-NL-259, 2024.

@misc{shinagawa2024setvse,
  title={集合型視覚言語埋め込み},
  author={品川政太朗 and 中村哲},
  booktitle={第259回自然言語処理研究発表会},
  pages={2024-NL-259},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
docker_env		docker_env
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
experiment_VSE.py		experiment_VSE.py
experiment_set_of_VSE.py		experiment_set_of_VSE.py
experiment_set_of_VSE_complete_sentence.py		experiment_set_of_VSE_complete_sentence.py
predict_clip_ret_score.py		predict_clip_ret_score.py
run_NL_experiments.sh		run_NL_experiments.sh
visualize_OT.ipynb		visualize_OT.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Set-VSE

使い方

インストール

Dockerの起動

実験の実行

実行例

オプションの説明

書誌情報 (for Citation)

About

Releases

Packages

Languages

License

ahclab/Set-VSE

Folders and files

Latest commit

History

Repository files navigation

Set-VSE

使い方

インストール

Dockerの起動

実験の実行

実行例

オプションの説明

書誌情報 (for Citation)

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages