Skip to content

Commit 5ff6713

Browse files
committed
Add link to CLARIN.SI entry in SIS.
1 parent e59dbd7 commit 5ff6713

File tree

2 files changed

+31
-10
lines changed

2 files changed

+31
-10
lines changed

dspace-xmlui/src/main/webapp/themes/UFAL/lib/html/data.html

Lines changed: 13 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -37,12 +37,16 @@
3737
<h2>CLARIN.SI guidelines for data submission</h2>
3838
<div id="intro">
3939
<p style="margin-top: 10px; margin-bottom: 10px;">The CLARIN.SI
40-
repository does not accept entries without data (i.e. without
40+
repository does not, as a rule, accept entries without data (i.e. without
4141
the bitstreams attached to the entry) and this document gives
4242
guidelines on the structure of the deposited language
4343
resources, which formats are accepted by the CLARIN.SI
4444
repository, and what standards should be used as the
45-
annotation formats in the textual language resource files.</p>
45+
annotation formats in the textual language resource files.
46+
Please note that the complete list of accepted data formats for CLARIN.SI
47+
is given in the CLARIN Standards Information System
48+
<a href="https://standards.clarin.eu/sis/views/view-centre.xq?id=CLARIN.SI">entry for CLARIN.SI</a>.
49+
</p>
4650
</div>
4751
<div id="toc_container">
4852
<p class="toc_title">Contents</p>
@@ -227,11 +231,13 @@ <h4>Dates and times</h4>
227231
<div id="binary">
228232
<h3>Accepted binary formats</h3>
229233
<p style="margin-top: 10px; margin-bottom: 10px;">CLARIN.SI accepts data in standard and/or
230-
well-known open formats (see also the CLARIN ERIC
231-
document <a href='http://www.clarin.eu/sites/default/files/Standards%20for%20LRT-v6.pdf'>Standards
232-
for LRT</a>). As most of the submissions involve marked-up or otherwise structured (mostly)
233-
textual data, and the rules here are somewhat more complicated, this is covered in the next
234-
section. Here we give the other (binary) formats accepted by CLARIN.SI:
234+
well-known open formats.
235+
For the full listing of accepted formats see the CLARIN ERIC Standards Information System
236+
<a href="https://standards.clarin.eu/sis/views/view-centre.xq?id=CLARIN.SI">entry for CLARIN.SI</a>.</p>
237+
238+
<p style="margin-top: 10px; margin-bottom: 10px;">As most of the submissions involve marked-up or otherwise
239+
structured (mostly) textual data, and the rules here are somewhat more complicated, this is covered in the
240+
next section. Here we give the other (i.e. binary) formats accepted by CLARIN.SI:
235241
<ul>
236242
<li><b>Compression and packaging:</b> GNU ZIP (.gz), ZIP (.zip), TAR (.tar), compressed
237243
TAR files (.tgz).</li>

dspace-xmlui/src/main/webapp/themes/UFAL/lib/html/sl/data.html

Lines changed: 18 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -36,7 +36,14 @@
3636
}</style>
3737
<h2>Navodila za vnos podatkov v repozitorij CLARIN.SI</h2>
3838
<div id="intro">
39-
<p style="margin-top: 10px; margin-bottom: 10px;">Repozitorij CLARIN.SI ne sprejema vnosov brez datotek (brez bitnih tokov, ki so dodani vnosu). V tem dokumentu so zbrani napotki glede ustrezne strukture deponiranih jezikovnih virov, primernih formatov podatkov in zahtevanih formatov označenih besedilnih datotek.</p>
39+
<p style="margin-top: 10px; margin-bottom: 10px;">Repozitorij CLARIN.SI praviloma ne sprejema vnosov brez datotek
40+
(tj. brez bitnih tokov, ki so dodani vnosu).
41+
V tem dokumentu so zbrani napotki glede ustrezne strukture deponiranih jezikovnih virov, primernih formatov
42+
podatkov in zahtevanih formatov označenih besedilnih datotek.
43+
Seznam formatov podatkov, ki jih sprejema CLARIN.SI je na voljo tudi v
44+
<a href="https://standards.clarin.eu/sis/views/view-centre.xq?id=CLARIN.SI">vnosu za CLARIN.SI</a>
45+
v okviru "CLARIN Standards Information System".
46+
</p>
4047
</div>
4148
<div id="toc_container">
4249
<p class="toc_title">Vsebina</p>
@@ -184,8 +191,16 @@ <h4>Datum in čas</h4>
184191
</div>
185192
<div id="binary">
186193
<h3>Ustrezni binarni formati</h3>
187-
<p style="margin-top: 10px; margin-bottom: 10px;"> Repozitorij CLARIN.SI sprejema podatke v standardnih in/ali splošno znanih odprtih formatih (dodatne informacije najdete v dokumentu CLARIN ERIC »<a href='http://www.clarin.eu/sites/default/files/Standards%20for%20LRT-v6.pdf'>Standardi za jezikovne vire in tehnologije</a>«). Pri večini vnosov v repozitorij gre za (večinoma) označene ali drugače strukturirane besedilne podatke. Ker zanje velja več zahtev kot za druge datoteke, jih podrobneje obravnavamo v nadaljevanju. Spodaj pa so našteti drugi (binarni) formati, ki jih repozitorij CLARIN.SI sprejema:
188-
<ul>
194+
<p style="margin-top: 10px; margin-bottom: 10px;">Repozitorij CLARIN.SI sprejema podatke v standardnih in/ali splošno znanih
195+
odprtih formatih.
196+
Seznam formatov, ki jih sprejema CLARIN.SI je na voljo v
197+
<a href="https://standards.clarin.eu/sis/views/view-centre.xq?id=CLARIN.SI">vnosu za CLARIN.SI</a>
198+
v okviru "CLARIN Standards Information System", v nadaljevanju pa naštejemo sprejete format glede na njihov namen.</p>
199+
200+
<p style="margin-top: 10px; margin-bottom: 10px;">Pri večini vnosov v repozitorij gre za (večinoma) označene ali drugače
201+
strukturirane besedilne podatke. Ker zanje velja več zahtev kot za druge datoteke, jih podrobneje obravnavamo v nadaljevanju.
202+
Spodaj pa so našteti drugi (binarni) formati, ki jih repozitorij CLARIN.SI sprejema:
203+
<ul>
189204
<li><b>Stiskanje in paketiranje virov:</b> GNU ZIP (.gz), ZIP (.zip), TAR (.tar), stisnjeni format TAR (.tgz).</li>
190205
<li><b>Datoteke dokumentov:</b> dokumenti, pripravljeni na tisk, so lahko deponirani v formatu PDF (.pdf), vendar v tem formatu sprejemamo samo spremno dokumentacijo (objavljeni članki ali poročila o naboru podatkov, navodila za označevanje itn.), glavnega nabora podatkov pa ne. Izjema so faksimili, ki so lahko deponirani v obliki zapisa slike ali v formatu PDF. </li>
191206
<li><b>Jezikovni modeli:</b> če orodja za označevanje ali druga odprtokodna orodja za analizo jezika ustvarjajo samo binarne jezikovne modele ali jih uporabljajo, jih repozitorij sprejema, vendar pa so bolj zaželene različice modelov v besedilnem formatu.</li>

0 commit comments

Comments
 (0)