[실험] Train_dials EDA #15
JAEWOOSUN
started this conversation in
Experiments
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
Train_dials EDA
Description: Train_dials 데이터 데이터 분석 및 시각화
시작일: 2021년 4월 28일
실험자: Moonjong Shin
제안자: HS J
종료일: 2021년 4월 29일
진행상황: 완료
카테고리: EDA
문제정의
Train, Eval 다이얼로그 분석을 통해 state, slot, value, domain에대한 분포를 알아보고
데이터의 이해를 높인다
해결 아이디어
진행상황
2. UNK 토큰 비율 및 갯수 확인
3. Turn기준 등장빈도가 높은 state, slot, value, domain 확인
상위 20개의 state가 전체 turn의 state중 차지하는 비율은 26.4% 정도로 나타난다.
4. Turn기준 하위 20개 state
적은 state들은 대체로 다양성이 높은 변수(시간)을 갖는다
코드링크:
https://drive.google.com/file/d/19PRB2kBRpBn16GYyQp5E_LSPoaSfs4PT/view?usp=sharing
분석 및 평가
상위 20개 state를
Beta Was this translation helpful? Give feedback.
All reactions