데이터셋

train test
데이터 개수 468,086 202,398
음식 종류 386 386

대분류 Analysis

Train 데이터를 대분류로 나눴을 때

Train 데이터를 대분류로 나눴을 때

대분류 train 비중 (%) 클래스 개수
구이류 4.52 17
국, 탕 찌개류 16.49 69
김치류 3.57 15
나물, 무침류 10.23 38
떡류 3.94 17
면, 만두류 10.97 43
밥류 14.52 59
볶음류 7.42 27
장아찌, 젓갈류 3.25 14
전, 부침류 6.26 23
조림류 5.12 20
죽, 스프류 3.32 13
찜류 3.28 13
튀김류 4.37 20
한과류 1.42 6
회류 1.41 6

음식(Class) Analysis

train test
count 386 386
mean 1212.66 524
std 175.33 78
min 144 62
25% 1198.25 514
50% 1254.00 537
75% 1271.00 548
max 1497 694

Tokenizer Analysis

mean 2.27
std 0.67
min 1.00
25% 2.00
50% 2.00
75% 3.00
max 6.00

추가 인사이트