Skip to content

Commit

Permalink
taxonomy: Added unknown Croatian ingredients to the taxonomy (part 9) (
Browse files Browse the repository at this point in the history
  • Loading branch information
benbenben2 authored and danwyk committed Nov 21, 2023
1 parent 928a271 commit d72dbcd
Show file tree
Hide file tree
Showing 7 changed files with 261 additions and 72 deletions.
21 changes: 18 additions & 3 deletions lib/ProductOpener/Ingredients.pm
Original file line number Diff line number Diff line change
Expand Up @@ -196,7 +196,7 @@ my %may_contain_regexps = (
fr =>
"peut également contenir|peut contenir|qui utilise|utilisant|qui utilise aussi|qui manipule|manipulisant|qui manipule aussi|traces possibles|traces d'allergènes potentielles|trace possible|traces potentielles|trace potentielle|traces éventuelles|traces eventuelles|trace éventuelle|trace eventuelle|traces|trace|Traces éventuelles de|Peut contenir des traces de",
hr =>
"mogući sadržaj|mogući tragovi|može sadržavati|može sadržavati alergene u tragovima|može sadržavati tragove|može sadržavati u tragovima|može sadržati|može sadržati tragove|proizvod može sadržavati|proizvod može sadržavati tragove",
"mogući ostaci|mogući sadržaj|mogući tragovi|može sadržavati|može sadržavati alergene u tragovima|može sadržavati tragove|može sadržavati u tragovima|može sadržati|može sadržati tragove|proizvod može sadržavati|proizvod može sadržavati tragove",
is => "getur innihaldið leifar|gæti innihaldið snefil|getur innihaldið",
it =>
"Pu[òo] contenere tracce di|pu[òo] contenere|che utilizza anche|possibili tracce|eventuali tracce|possibile traccia|eventuale traccia|tracce|traccia",
Expand Down Expand Up @@ -351,7 +351,7 @@ my %abbreviations = (

fr => [["vit.", "Vitamine"], ["Mat. Gr.", "Matières Grasses"],],

hr => [["temp.", "temperaturi"],],
hr => [["temp.", "temperaturi"], ["regul. kisel.", "regulator kiselosti"], ["reg. kis.", "regulator kiselosti"],],

nb => [["bl. a.", "blant annet"], ["inkl.", "inklusive"], ["papr.", "paprika"],],

Expand Down Expand Up @@ -1048,6 +1048,7 @@ sub parse_specific_ingredients_from_text ($product_ref, $text, $percent_or_quant
en => "min|minimum|total",
es => "total",
fr => "min|minimum|minimal|minimale|total|totale",
hr => "najmanje|najviše",
sv => "total",
);
my $minimum_or_total = $minimum_or_total{$ingredients_lc} || '';
Expand All @@ -1057,7 +1058,7 @@ sub parse_specific_ingredients_from_text ($product_ref, $text, $percent_or_quant
en => "(?:(?:$minimum_or_total) )?content",
es => "contenido(?: (?:$minimum_or_total))",
fr => "(?:teneur|taux)(?: (?:$minimum_or_total))?(?: en)?", # need to have " en" as it's not in the $of regexp
hr => "ukupni",
hr => "ukupni(?: udio)?",
sv => "(?:(?:$minimum_or_total) )?mängd",
);
my $content_of_ingredient = $content_of_ingredient{$ingredients_lc};
Expand Down Expand Up @@ -2528,6 +2529,8 @@ sub parse_ingredients_text_service ($product_ref, $updated_product_fields_ref) {
'^u tragovima$', # in traces
'čokolada sadrži biljne masnoće uz kakaov maslac'
, # Chocolate contains vegetable fats along with cocoa butter
'može imati štetno djelovanje na aktivnosti pažnju djece'
, # can have a detrimental effect on children's attention activities (E122)
'označene podebljano', # marked in bold
'savjet kod alergije', # allergy advice
'u čokoladi kakaovi dijelovi'
Expand Down Expand Up @@ -4626,6 +4629,7 @@ my %phrases_after_ingredients_list = (
'Čuvati na (hladnom|sobnoj temperaturi|suhom|temperaturi)', # store in...
'Čuvati zatvoreno na',
'Čuvati pri sobnoj temperaturi',
'Čuvajte u zamrzivaču na',
'izvor dijetalnih vlakana', # source of proteins
'najbolje upotrijebiti do', # best before
'nakon otvaranja', # after opening
Expand All @@ -4634,6 +4638,7 @@ my %phrases_after_ingredients_list = (
'proizvođač', # producer
'prosječn(a|e) (hranjiva|hranjive|nutritivne) (vrijednost|vrijednosti)', # Average nutritional value
'protresti prije otvaranja', # shake before opening
'suha tvar min', # dry matter min 9%
'upotrijebiti do datuma', # valid until
'upozorenje', # warning
'uputa', # instructions
Expand Down Expand Up @@ -5290,6 +5295,11 @@ my %ingredients_categories_and_types = (
],

hr => [
# cheeses
{
categories => ["sirevi",],
types => ["polutvrdi", "meki",]
},
# malts
{
categories => ["slad",],
Expand All @@ -5300,6 +5310,11 @@ my %ingredients_categories_and_types = (
categories => ["mlijeko",],
types => ["s 1.0% mliječne masti",]
},
# oils and fats
{
categories => ["biljna mast", "biljne masti", "biljna ulja",],
types => ["palmina", "palmine", "repičina", "repičino", "suncokretovo",]
},
],

pl => [
Expand Down
6 changes: 3 additions & 3 deletions taxonomies/additives.txt
Original file line number Diff line number Diff line change
Expand Up @@ -14289,7 +14289,7 @@ es:E471, mono- y diglicéridos de ácidos grasos, Monoglicéridos y diglicérido
et:E471, Rasvhapete mono- ja diglütseriidid, Glütserüülmonostearaat, glütserüülmonopalmitaat, glütserüülmonooleaat, monosteariin, monopalmitiin
fi:E471, Rasvahappojen mono- ja diglyseridit, Glyseryylimonostearaatti, Glyseryylimonopalmitaatti, Glyseryylimono-oleaatti, Monosteariini, Monopalmitiini, Mono-oleiini
fr:E471, Mono- et diglycérides d'acides gras, Mono- et diglycérides d'acides gras alimentaires, Monoglycérides et diglycérides d'acides gras, Mono et diglycérides d'acides gras, Monostéarate de glycérine, Monopalmitate de glycérine, Monooléate de glycérine, Monostéarine, monopalmitine, monooléine, Mono and diglycerides of fatty acids, glyceryl monostearate, glyceryl distearate , Monostéarine
hr:E471, mono- i digliceridi masnih kiselina, mono - i digliceridi masnih kiselina, emulgator mono - i digliceridi masnih kiselina, emuglator e471, emulgator mono i digliceridi masnih kiselina, monogliceridi i digliceridi masnih kiselina e471, mono- i diglicerida masnih kiselina, mono - i diglicerida masnih kiselina
hr:E471, mono- i digliceridi masnih kiselina, mono - i digliceridi masnih kiselina, emulgator mono - i digliceridi masnih kiselina, emuglator e471, emulgator mono i digliceridi masnih kiselina, monogliceridi i digliceridi masnih kiselina, monogliceridi i digliceridi masnih kiselina e471, mono- i diglicerida masnih kiselina, mono - i diglicerida masnih kiselina
hu:E471, Zsírsavak mono- és digliceridjei, Gliceril-monosztearát, Gliceril-monopalmitát, Gliceril-monooleát, Monosztearin, monopalmitin, monoolein
it:E471, Mono- e digliceridi degli acidi grassi, Monostearato di glicerile, monopalmitato di glicerile, monooleato di glicerile, monostearina, monopalmitina, monooleina, mono- e digliceridi degli acidi grassi alimentari
lt:E471, Riebalų rūgščių mono- ir digliceridai, Glicerilmonostearatas, glicerilmonopalmitatas, glicerilmonooleatas, monostearinas, monopalmitinas, monooleinas
Expand Down Expand Up @@ -14489,7 +14489,7 @@ et:E472d, Rasvhapete mono- ja diglütseriidide estrid viinhappega
fi:E472d, Rasvahappojen mono- ja diglyseridien viinihappoesterit, Rasvahappojen mono- ja diglyseridien viinihappoestereitä
fr:E472d, Ester tartrique de mono- et diglycérides d'acides gras, Esters tartriques de mono- et di-glycérides d'acides gras, Esters tartriques des mono- et diglycérides, Esters tartriques des mono- et diglycérides d'acides gras
gl:E472d, Éster tártrico de mono- e diglicéridos de ácidos graxos
hr:E472d
hr:E472d mono - i diacetilni esteri vinske kiseline mono - i diglicerida masnih kiselina
hu:E472d, Zsírsavak mono- és digliceridjeinek borkősav-észterei
it:E472d, Esteri tartarici di mono- e digliceridi degli acidi grassi
ja:E472d, グリセリン酒石酸脂肪酸エステル
Expand Down Expand Up @@ -18623,7 +18623,7 @@ fr:E621, Glutamate monosodique, glutamate de sodium, monoglutamate de sodium, mo
ga:E621, Glútamáit aonsóidiam
he:E621, מונוסודיום גלוטמט
hi:E621, मोनोसोडियम ग्लूटामेट
hr:E621, mononatrijev glutaminat, mononatrijev glutamin, mononatrij glutaminat, mononatrij glutamat, natrijev glutaminat
hr:E621, mononatrijev glutaminat, mononatrijev glutamin, mononatrij glutaminat, mononatrij glutamat, natrijev glutaminat, pojačivač arome-mononatrij glutaminat, MONONATRIJEV GLUTAMAT
hu:E621, Mononátrium-glutamát, Nátrium-glutamát
id:E621, Mononatrium glutamat
is:E621, MSG
Expand Down
8 changes: 4 additions & 4 deletions taxonomies/additives_classes.txt
Original file line number Diff line number Diff line change
Expand Up @@ -71,7 +71,7 @@ fi: Happamuudensäätöaine, Happamuudensäätöaineet, Happamuudensäätöainet
fr: Correcteur d’acidité, régulateur de l'acidité, régulateur d'acidité, agent tampon, ajusteur du pH, alcali, base, tampon
ga: Rialtán aigéadachta
he:מווסת חומציות
hr: regulator kiselosti, regulatori kiselosti, tvar za rahljanje, tvar za regulaciju, tvar za regulaciju kiselost
hr: regulator kiselosti, regulatori kiselosti, regulator kiselost, tvar za rahljanje, tvar za regulaciju, tvar za regulaciju kiselost
hu: Savanyúságot szabályozó anyag, Savanyúságot szabályozó anyagok, Savanyúságot szabályzó anyag, Savanyúságot szabályzó anyagok
id: pengatur keasaman
is: Sýrustillir, Sýrustillar
Expand Down Expand Up @@ -461,7 +461,7 @@ et: Emulgaator
fi: Emulgointiaine, Emulgointiainetta, Emulgointiaineet, Emulgointiaineita
fr: Émulsifiant, agent de dispersion, agent de surface, agent de suspension, agent d'ajustement de la densité, inhibiteur de cristallisation, nébulisant, plastifiant
ga: Eiblitheoir
hr: emulgator, emulgatori, emlgatori, emuglator
hr: emulgator, emulgatori, emlgatori, emuglator, smjesa za emulgiranje
hu: Emulgeálószer, emulgeálószerek, kristályosodásgátló, sűrűségszabályozó szer, diszpergálószer, lágyító, felületaktív anyag, szuszpenziós szer
is: Yruefni
it: Emulsionante, emulsionanti, agente emulsionante, agenti emulsionanti
Expand Down Expand Up @@ -515,7 +515,7 @@ et: Emulgeeriv sool
fi: Sulatesuola, Sulatesuolaa, Sulatesuolat, Sulatesuoloja
fr: Sels émulsifiants, sel émulsifiant, sels de fonte, sel de fonte, synergiste de sel émulsifiant
ga: Salainn eiblithe
hr: emulgatorske soli
hr: emulgatorske soli, emulgatorska sol
hu: Emulgeálósók
is: Bræðslusölt
it: Sale di fusione, sali di fusione
Expand Down Expand Up @@ -618,7 +618,7 @@ et: Lõhna- ja maitsetugevdaja
fi: Arominvahvenne, Arominvahvennetta, Arominvahventeet, Arominvahventeita, Aromivahvenne, Aromivahvennetta, Aromivahventeen, Aromivahventeita
fr: Exhausteur de goût, exhausteurs de goût, Exaltateur d'arôme, agent de sapidité, activateur d'arôme, exaltateur de goût, exhausteur d'arôme, exhausteurs de saveur, exhausteur de saveur
ga: Méadaitheoir blais
hr: pojačivač okusa, pojačivači okusa, sirup pojačivač okusa, pojačivač arome, pojačivači arome, pojačivači aroma, poboljšivač
hr: pojačivač okusa, pojačivači okusa, sirup pojačivač okusa, pojačivač arome, pojačivači arome, pojačivači aroma, poboljšivač, smjesa poboljšivača
hu: Ízfokozó, Ízfokozók
it: Esaltatore di sapidità, esaltatori di sapidità
lt: Aromato ir skonio stipriklis
Expand Down
4 changes: 2 additions & 2 deletions taxonomies/allergens.txt
Original file line number Diff line number Diff line change
Expand Up @@ -208,7 +208,7 @@ fi:soija, soijaa, soijasta, soijat, soijia, soijista, soijapapu, soijapapua, soi
fr:soja, soya, soia, sojas, son de soja, lécithine de soja, tonyu, graine de soja, graines de soja, tofu
ga:pónairí soighe, soighe
he:סויה, פולי סויה, לציטין סויה, קמח סויה
hr:soje, sojin, sojina, sojini, sojino, soju, sojin lecitin, sojini lecitini, sojinih proizvoda
hr:soja, soje, sojin, sojina, sojini, sojino, soju, sojin lecitin, sojini lecitini, sojinih proizvoda
hu:szója, szójabab, szójalecitin, szójalecitinek, szójatej, szójaliszt, szójafehérje, szójából, szóját
is:soja
it:soia, lecitina di soia
Expand Down Expand Up @@ -279,7 +279,7 @@ fi:pähkinät, pähkinä, pähkinää, pähkinästä, pähkinöitä, pähkinöis
fr:fruits à coque, amandes, noisettes, noix, noix de cajou, noix de pécan, noix du Brésil, pistaches, noix de Macadamia, noix du Queensland, fruits secs, autres fruits secs, autres fruits à coque, fruits secs à coque, fruits à coque dure
ga:cnónna, almóinní, cnónna coill, gallchnónna, cnónna caisiú, cnónna peagáin, cnónna Brasaíleacha, cnónna pistéise, cnónna macadaíme, cnónna Thír na Banríona
he:אגוזים, שקדים, פקאן, אגוז ברזיל, אגוז מלך, פיסטוק, קשיו, ערמונים,מקדמיה
hr:orašaste plodove, orašastih plodova, orašasto voće, orašasto voče, orašastog voća, ostalih orašastih plodova, ostalo orašasto voće, ostalog orašastog voća, drugo orašasto voće, drugog orašastog voća, badem, badema, bademe, bademi, lješnjak, lješnjaka, lješnjake, lješnjaci, pistacije, drugih orašastih plodova, druge orašaste plodove, orah, orah jezgra, orahe
hr:orašaste plodove, orašastih plodova, orašasto voće, orašasto voče, orašastog voća, ostalih orašastih plodova, ostalo orašasto voće, ostalog orašastog voća, drugo orašasto voće, drugog orašastog voća, badem, badema, bademe, bademi, lješnjak, lješnjaka, lješnjake, lješnjaci, pistacije, drugih orašastih plodova, druge orašaste plodove, orah, orah jezgra, orahe, i ljuske orašastog voća te koštice, i ljeske orašastog voća te koštice, i ostale orašaste plodove
hu:diófélék, mandula, mogyoró, dió, kesudió, pekándió, brazil dió, pisztácia, makadámia, queenslandi dió, dióféléket
is:hnetur
it:frutta a guscio, mandorle, nocciole, noci, noci di acagiù, noci di pecan, noci del Brasile, pistacchi, noci macadamia, noci del Queensland
Expand Down
Loading

0 comments on commit d72dbcd

Please sign in to comment.