@@ -257,10 +257,9 @@ def test_single_tokens():
257
257
[
258
258
Tok (
259
259
TOK .WORD ,
260
- "m.kr" ,
260
+ "m.kr. " ,
261
261
[("milljónir króna" , 0 , "kvk" , "skst" , "m.kr." , "-" )],
262
262
),
263
- Tok (TOK .PUNCTUATION , "." , None ),
264
263
],
265
264
),
266
265
(
@@ -652,7 +651,7 @@ def test_sentence(text, expected, **options):
652
651
" Góðan daginn! Ég á 10.000 kr. í vasanum, €100 og $40.Gengi USD er 103,45. "
653
652
"Í dag er 10. júlí. Klukkan er 15:40 núna.Ég fer kl. 13 niður á Hlemm o.s.frv. " ,
654
653
"B W W P E B W W A W W P A W A P E B W W W N P E "
655
- "B W W W DR P E B W W T W P E B W W T W W W W P E" ,
654
+ "B W W W DR P E B W W T W P E B W W T W W W W E" ,
656
655
)
657
656
658
657
test_sentence (
@@ -686,15 +685,15 @@ def test_sentence(text, expected, **options):
686
685
"Málið um BSRB gekk marg-ítrekað til stjórnskipunar- og eftirlitsnefndar í 10. sinn "
687
686
"skv. XVII. kafla þann 24. september 2015 nk. Ál-verið notar 60 MWst á ári." ,
688
687
"B W W W W W W W W O W "
689
- "W O W W DA W P E B W W ME W W P E" ,
688
+ "W O W W DA W E B W W ME W W P E" ,
690
689
)
691
690
692
691
test_sentence (
693
692
"Ég er t.d. með tölvupóstfangið fake@news.com, vefföngin "
694
693
"http://greynir.is og https://greynir.is, og síma 6638999. Hann gaf mér 1000 kr. Ég keypti mér 1/2 kaffi. "
695
- "Það er hægt að ná í mig í s. 623 7892, eða vinnusíma, 7227979 eða eitthvað." ,
694
+ "Það er hægt að ná í mig í s 623 7892, eða vinnusíma, 7227979 eða eitthvað." ,
696
695
"B W W W W W M P W "
697
- "U W U P W W TEL P E B W W W A P E B W W W N W P E "
696
+ "U W U P W W TEL P E B W W W A E B W W W N W P E "
698
697
"B W W W W W W W W W TEL P W W P TEL W W P E"
699
698
)
700
699
@@ -736,7 +735,7 @@ def test_sentence(text, expected, **options):
736
735
737
736
test_sentence (
738
737
"1.030 hPa lægð gengur yfir landið árið 2019 e.Kr. Jógúrtin inniheldur 80 kcal." ,
739
- "B ME W W W W Y P E B W W ME P E" ,
738
+ "B ME W W W W Y E B W W ME P E" ,
740
739
)
741
740
742
741
test_sentence (
@@ -780,7 +779,7 @@ def test_sentence(text, expected, **options):
780
779
)
781
780
782
781
test_sentence (
783
- "Þórdís Kolbrún Reykfjörð Gylfadóttir var skipuð viðskipta-, dómsmála-, ferðamála- og iðnaðarráðherra þann 12. mars 2019." ,
782
+ "Þórdís Kolbrún Reykfjörð Gylfadóttir var skipuð viðskipta- dómsmála- ferðamála- og iðnaðarráðherra þann 12. mars 2019." ,
784
783
"B W W W W W W W W DA P E" ,
785
784
)
786
785
@@ -801,7 +800,7 @@ def test_sentence(text, expected, **options):
801
800
802
801
test_sentence (
803
802
"Fyrri setningin var í þgf. en sú seinni í nf. Ég stóð í ef. en hann í þf. Hvað ef." ,
804
- "B W W W W W W W W W W P E B W W W W W W W W P E B W W P E" ,
803
+ "B W W W W W W W W W W E B W W W W W W W W E B W W P E" ,
805
804
)
806
805
807
806
test_sentence (
@@ -836,7 +835,7 @@ def test_sentence(text, expected, **options):
836
835
837
836
test_sentence (
838
837
"Jón, kt. 301265-5309, vann 301265-53090 kr. H2O var drukkið." ,
839
- "B W P W K P W N P A P E B MO W W P E" ,
838
+ "B W P W K P W N P A E B MO W W P E" ,
840
839
)
841
840
842
841
test_sentence (
0 commit comments