Skip to content

Commit a632fa8

Browse files
Merge pull request #26 from mideind/abbrevchanges
Abbrevchanges
2 parents bb1f2d9 + be7c9b7 commit a632fa8

File tree

3 files changed

+455
-2
lines changed

3 files changed

+455
-2
lines changed

src/tokenizer/Abbrev.conf

Lines changed: 16 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -477,6 +477,7 @@ f.á.* = "fyrra ár" ao frasi # Eða fyrra árs, mætti geta beygt.
477477
Fbl.* = "Fréttablaðið" hk
478478
fh. = "framsöguháttur" kk
479479
fjölb.* = "fjölbraut" kvk
480+
frák.* = "fráköst" hk
480481
frj.* = "frjáls" lo
481482
fl.* = "fleira" ao
482483
fl.* = "fleiri" lo
@@ -570,7 +571,7 @@ kgl.* = "konunglegur" lo
570571
kk.* = "karlkyn" hk
571572
kk.* = "karlkyns" ao
572573
kl. = "klukkan" ao
573-
klst.* = "klukkustund" kvk
574+
klst. = "klukkustund" kvk
574575
kosn.* = "kosningar" kvk
575576
kostn.* = "kostnaður" kk
576577
kt. = "kennitala" kvk
@@ -677,6 +678,7 @@ opinb.* = "opinber" lo
677678
orðab.* = "orðabók" kvk
678679
orðasamb.* = "orðasamband" hk
679680
p.s. = "eftirskrift" kvk
681+
ps. = "eftirskrift" kvk # Villa
680682
pers. = "persóna" kvk
681683
pfn.* = "persónufornafn" hk
682684
pk.* = "pakki" kk
@@ -773,6 +775,7 @@ sérfr.* = "sérfræðingur" kk
773775
sérn.* = "sérnafn" hk
774776
sérst.* = "sérstakur" lo
775777
sérísl.* = "séríslenskur" lo
778+
s.* = "símanúmer" hk
776779
símanr.* = "símanúmer" hk
777780
snr. = "símanúmer" hk
778781
síðarn.* = "síðarnefndur" lo
@@ -838,6 +841,7 @@ viðsk.* = "viðskipti" hk
838841
viðsk.* = "viðskeyti" hk
839842
viðsk.* = "viðskiptafræðingur" kk
840843
viðsk.* = "viðskiptafræði" kvk
844+
vs. = "gegn" fs # erlent, villa.
841845
vsk.* = "virðisaukaskattur" kk
842846
vsk.* = "viðskeyti" hk
843847
vt.* = "viðtakandi" kk
@@ -1094,7 +1098,7 @@ M.Litt.* = "Master of Letters" hk erl
10941098
M.P.M.* = "Master of Project Management" hk erl
10951099
M.Phil = "Master of Philosophy" hk erl
10961100
M.S.* = "Master of Science" hk erl
1097-
M.Sc.* = "Master of Science" hk erl
1101+
M.Sc. = "Master of Science" hk erl
10981102
MBA = "Master of Business Administration" hk erl
10991103
MEd = "Master of Education" hk erl
11001104
MLitt = "Master of Letters" hk erl
@@ -1492,6 +1496,16 @@ Yb = "ytterbíum" hk
14921496
Zn = "sink" hk
14931497
Zr = "sirkon" hk
14941498

1499+
# Mælieiningar ranglega með punkti
1500+
1501+
km.* = "kílómetri" kk
1502+
mm.* = "millímetri" kk
1503+
sm.* = "sentímetri" kk
1504+
cm.* = "sentímetri" kk
1505+
1506+
# Mælieiningar réttilega með punkti
1507+
kcal.* = "kílókaloría" kvk
1508+
14951509
# Orðmyndir sem á aldrei að skilja sem skammstöfun
14961510
# ef þær eru án punkts, ekki einu sinni sem
14971511
# ranga skammstöfun

src/tokenizer/definitions.py

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -475,6 +475,10 @@ def make_str(s):
475475
# Percentage and promille
476476
"%": ("%", 1.0),
477477
"‰": ("‰", 0.1),
478+
# Velocity
479+
"m/s": ("m/s", 1.0),
480+
"km/klst": ("m/s", 1000.0/(60*60)),
481+
#"km/klst.": ("m/s", 1000.0/(60*60)),
478482
} # type: Dict[unicode, Tuple[unicode, Union[float, Callable[[float], float]]]]
479483

480484
DIRECTIONS = {

0 commit comments

Comments
 (0)