[ang.] datafication -
[pol.] danetyzacja, udanowienie
AKTUALIZACJA [2021.06.18]
Na posiedzeniu Zespołu Terminologii Informatycznej przedyskutowano możliwe tłumaczenia ang. pojęcia datafication. Postanowiono:
- zanegować używanie pol. pojęcia datafikacja ze względu na mylący rdzeń data oznaczający datę, a nie daną czy dane.
- zaakceptować pol. pojęcie danetyzacja , chociaż budzące pewien niepokój w jego rozumieniu.
- wprowadzić i promować nowe pol. pojęcie udanowienie.
[więcej na ten temat ponizej w ostatnim akapicie]
W tym eseju terminologicznym poszukuję uzasadnienia na termin pol. odpowiadający ang. terminowi datafication.
Uzasadnienie to było przygotowane do dyskusji na posiedzeniu Zespołu Terminologii Informatycznej.
Dziękuję Prof. Wojciechowi Cellaremu za istotne komentarze prowadzące do poprawienia treści tego eseju.
Na początek przytaczam jedną z wielu definicji pojęcia datafication [1]:
Datafication refers to the process by which subjects, objects, and practices are transformed into digital data. Associated with the rise of digital technologies, digitization, and big data, many scholars argue datafication is intensifying as more dimensions of social life play out in digital spaces.
Zanim dalej skupimy się na analizie propozycji polskiego tłumaczenia terminu datafication, dokonajmy pojęciowej analizy procesu przetwarzania danych zapisanych w postaci analogowej w dane w postaci cyfrowej. Zacznijmy od terminu dokument:
Dokument [wg PWN]:
- pismo urzędowe, dowód stwierdzający czyjąś tożsamość,
- materiał w postaci tekstu, fotografii lub jakikolwiek przedmiot, mający wartość dowodową lub informacyjną,
- plik komputerowy zawierający informacje zapisane w odpowiednim formacie,
- nośnik informacji umożliwiający zapoznanie się z jej treścią [art.773. Kodeks Cywilny].
Nie ma pojęcia dokumentu analogowego, gdyż z definicji wszystkie dokumenty były (teraz tylko niektóre) analogowe. Teraz można powiedzieć, że ta mapa, fotografia, dokument jest w postaci analogowej i dla przetwarzania w komputerze musi być przetworzona w postać cyfrową – w dokument elektroniczny.
Dokument elektroniczny [ Ustawa o informatyzacji podmiotów….]
- stanowiący odrębną całość znaczeniową zbiór danych uporządkowanych w określonej strukturze wewnętrznej i zapisany na informatycznym nośniku danych - czyli materiale lub urządzeniu służącym do zapisywania, przechowywania i odczytywania danych w postaci cyfrowej.
Prawnicy zwracają uwagę na liczne nieścisłości sformułowań ustawowych i wątpliwości związane z ich stosowaniem. W szczególności, wg nich, przy dosłownym traktowaniu zapisu ustawy, dokument elektroniczny nie może być przesyłany drogą elektroniczną, gdyż wówczas, jako niezapisany na nośniku danych, traci swój charakter (przestaje być dokumentem elektronicznym w rozumieniu ustawy). Z technicznego punktu widzenia nie ma takiego problemu, gdyż dokument przy przesyłąniu jest zapisany na nośniku nadawcy i potem fragmnetami na nośniku transmisji dołączając do zapsiu na nośniku odbiorcy - co spełnia zapis definicji. Dodatkowo z treści art. 14 § 1 kpa, wynika wprost doręczanie, czyli presyłanie dokumentów elektronicznych środkami komunikacji elektronicznej [2].
W kodeksie cywilnym mówimy tylko o formie elektronicznej [Art. 781 Forma elektroniczna]
- § 1. Do zachowania elektronicznej formy czynności prawnej wystarcza złożenie oświadczenia woli w postaci elektronicznej i opatrzenie go kwalifikowanym podpisem elektronicznym.
- § 2. Oświadczenie woli złożone w formie elektronicznej jest równoważne z oświadczeniem woli złożonym w formie pisemnej.
Dokument elektroniczny [art. 3 pkt 35 rozporządzenia Parlamentu Europejskiego i Rady (UE) nr 910/2014] -
- oznacza każdą treść przechowywaną w postaci elektronicznej, w szczególności tekst lub nagranie dźwiękowe, wizualne lub audiowizualne;
Podany w definicjach dokument elektroniczny jest odmianą dokumentu papierowego (przymiotnik określa rodzaj nośnika) podobnie jak postać elektroniczna odpowiada postaci papierowej. Takie pojęcia pojawiają się w zapisach prawnych i są używane w administracji i obiegu prawnym.
Równocześnie w obiegu technicznym jest używane, bardziej poprawne, równoważne co do definicji pojęcie dokumentu cyfrowego wobec dokumentu analogowego (przymiotnik określa sposób zapisu danych) oraz odpowiednio postać cyfrowa wobec postaci analogowej. W niektórych pojęciach - np. podpis cyfrowy jest rozumiany nieco inaczej niż podpis elektroniczny. Występuje jeszcze przymiotnik binarny - dokument binarny, ale tutaj to pomińmy. Ten bałagan pojęciowy jest wynikiem braku odpowiedniej dyskusji analizy językowej w chwili pojawiania się tych pojęć z pozostawieniem ustalenia nazw tłumaczom i prawnikom bez konsultacji z informatykami.
Skanowanie i rozpoznawanie
Tutaj mamy stosunkowo proste tłumaczenie ang. terminów na polski.
Skanowanie, skanować [wg PWN]
- wprowadzać do komputera informację graficzną za pomocą skanera,
- convert (a document or picture) into digital form for storage or processing on a computer. [tłum. z Oxford Dictionary] – konwertowanie (dokumentu lub obrazu) w postać cyfrową do zapamiętania lub przetwarzania przez komputer,
- skanowanie dokumentów i konwertowanie na dane cyfrowe.
Rozpoznawanie znaków (ang. character recognition)
- optyczne rozpoznawanie znaków - OCR (ang. optical character recognition),
- rozpoznawanie pisma (od)ręcznego – HWR (ang. handwriting recognition),
- inteligentne rozpoznawanie znaków – ICR (ang. intelligent character recognition).
Digitalizacja
W języku angielskim odnajdujemy dwa pojęcia:
- digitization [am.], digitisation [br.]
- digitalization [am.], digitalisation [br.]
W słownikach ang. oba pojęcia mają odmienne definicje, np.:
Digitization, digitaze
- the conversion of text, pictures, or sound into a digital form that can be processed by a computer [3].
Digitalization (definicja z obszaru medycyny)
- the administration of digitalis, usually in a regimen, to produce a desired physiological effect [4] .
Digitalization bywa też synonimem digitization, ale silniej jest definiowane w obszarze biznesowym. np. przez Gartnera:
- is the use of digital technologies to change a business model and provide new revenue and value producing opportunities; it is the process of moving to a digital business [5] .
Znajdujemy też wyjaśnienie różnicy pomiędzy tymi pojęciami: Digitization versus Digitalization [6] :
Digitization is the conversion of analog to digital, whereas digitalization is the use of digital technologies and digitized data to impact how work gets done, transform how customers and companies engage and interact, and create new (digital) revenue streams.
Według Google Ngram Viewer możemy sprawdzić popularność każdego z tych pojęć w korpusie British English oraz American English. Widzimy przewagę pojęcia digitization wobec rosnącego w czasie popularności pojęcia digitalization. Terminy pisane przez „s” zamiast „z” są znacząco mniej popularne.
Pytaniem jest też, które z tych pojęć digitization czy digitalization jest przetłumaczone na polski jako digitalizacja lub dygitalizacja, a szczególnie jako cyfryzacja?
Collins Dictionary | PWN Translatica | Google-Tłumacz | |
digitization | digitalizacji | cyfryzacja, dyskretyzacja, digitalizacyjny | digitalizacja |
digitalization | cyfryzacja | digitalizacyjny | digitalizacja |
Jak widać ne ma jednoznacznego tłumaczenia. Definicja tych pojęć w Słowniku PWN:
dygitalizacja, digitalizacja
- nadawanie postaci cyfrowej danym pisanym i drukowanym, zawartym na nośnikach magnetycznych lub innych.
cyfryzacja
- zob. dygitalizacja
- 2. rozpowszechniać i popularyzować technikę cyfrową oraz wprowadzać na szeroką skalę infrastrukturę elektroniczną.
Dokonajmy jeszcze tłumaczenia wyjaśnienia różnicy pomiędzy Digitization versus Digitalization (wersji angileskiej, przytoczonej powyżej), korzystając tłumacza Google’a (jak widać, tutaj Google już wiedział, że digit to cyfra):
Cyfryzacja to konwersja sygnału analogowego na cyfrowy, podczas gdy cyfryzacja to wykorzystanie technologii technik cyfrowych i zdigitalizowanych danych w postaci cyfrowej w celu wpływania na sposób wykonywania pracy, zmiany sposobu angażowania się i interakcji klientów i firm oraz tworzenia nowych (cyfrowych) strumieni przychodów.
Podsumowanie analizy potrzeby używania pojęć: digitalizacja, dygitalizacja, cyfryzacja:
- Przetłumaczenia ang. digitization oraz digitalization na pol. digitalizację świadczy o braku elementarnej wiedzy, że ang. digit, to pol. cyfra, która powinna być znana od wielu lat.
- Pojawienie się drugiej formy tłumaczenia dygitalizacja, usiłującej spolszczyć ten termin jest też oznaką braku językoznawców w otoczeniu.
- W wyszukiwarce PELCRA dla NKJP (z 2010 roku) sprawdzono częstość występowania tych pojęć: digitalizacja - 41, cyfryzacja – 26 oraz dygitalizacja -3. Można przyjąć, że termin dygitalizacja powinien być usunięty z użycia.
- Obecnie, przy znaczącym wzroście popularności terminu cyfryzacja, pracownicy archiwów oraz bibliotek dalej uparcie dokonują digitalizacji zbiorów, aby mieć je w postaci cyfrowej! 5. Miejmy nadzieję, że termin digitalizacja też z czasem zostanie wyparty przez termin cyfryzacja.
Datacja
Przy okazji przeglądania słowników [PWN] odnalazło się pojęcie datacja, datowanie (ang. chronological dating).
- ustalenie daty jakiegoś wydarzenia lub daty powstania czegoś;
- formuła określająca miejsce i czas podpisania dokumentu międzynarodowego;
Warto podkreślić, że w języku polskim ang. data może być pol. data lub dana, dane.
Datafikacja, danetyzacja
Przechodząc do interesującego nas pojęcia ang. datafication, przetłumaczonego na pol. datafikacja oraz danetyzacja, zapoznajmy się z dwoma tekstami:
Datafikacja czy danetyzacja? [7] Pytanie do Rady Języka Polskiego 18.06.2019
„Szanowni Państwo, która forma jest poprawna językowo: datafikacja czy danetyzacja? W literaturze przedmiotu pojawia się jedna i druga. Pozdrowienia”.
Obie nazwy są terminami stosowanymi w socjologii i odnoszą się do „kwantyfikowania i przekładania wszelkich elementów rzeczywistości na dane, by móc je poddać agregowaniu i algorytmizacji” (Łukasz Iwasiński, Społeczne zagrożenia danetyzacji rzeczywistości, „ReaserchGate”, Datafikacja jest zapożyczeniem właściwym – jej źródłem jest angielskie datafication (od ang. data‘dane’), danetyzacja zaś to zapożyczenie strukturalne, czyli kalka rzeczownika angielskiego (obcy element data został odwzorowany za pomocą polskiego odpowiednika – dane). Oba typy zapożyczeń są akceptowane w języku, a zatem jeśli oba występują (a występują) w literaturze naukowej, to należy ten stan rzeczy uznać.
Katarzyna Kłosińska, Uniwersytet Warszawski
Jeszcze ciekawa analiza ze Zjazdu Filozoficznego (wrzesień 2019)[8]
... kiedy wraz z cyfrowymi technologiami i ich potencjałem gromadzenia oraz przetwarzania danych pojawiała się szansa na „obiektywizację” procesów wiedzotwórczych, wykorzystano ją i zaczęto wręcz mówić o narodzinach czwartego paradygmatu nauki, opartego o big data i data science. Rozpoczęło to procesy danetyzacji, danetyfikacji mogące prowadzić ostatecznie do dataizmu (pojęcie Yuvala Noaha Harariego), czyli wiary w nieograniczoną siłę algorytmów, jako narzędzi odczytywania „wzorów świata”, pozwalających czynić realność inteligibilną. W refleksji przyjmuje się, że nasilające się tendencje danetyfikacyjne mogą spowodować ukonstytuowanie się datacentrycznego sposób postrzegania wszystkich aspektów rzeczywistości, czyniąc z algorytmów rodzaj „wyższej instancji” kształtującej ludzki sposobu myślenia o świecie.
Biorąc to wszystko powyższe z tego eseju pod uwagę należy przyjąć, że pojęciu ang. datafication powinno odpowiadać wyłącznie słowo pol. danetyzacja. Przemawiają za tym następujące argumenty:
- koniecznie jest poprawne przetłumaczenie rdzenia data na dane, gdyż nie dotyczy to daty kalendarzowej,
- końcówka w tym przypadku jest identyczna z końcówką słowa cyfryzacja.
Definicja danetyzacji jest następująca:
Danetyzacja to proces, w którym podmioty, obiekty i praktyki są przekształcane w dane cyfrowe. W związku z rozwojem technik cyfrowych, cyfryzacji i gigadanych, aktualnie obserwuje się nasilenie danetyzacj, ponieważ w przestrzeni cyfrowej rozgrywa się coraz więcej wymiarów życia społecznego i gospodarczego.
AKTUALIZACJA [2021.06.18]
Ciekawą propozycją Zespołu Terminologii INformatycznej (Krzzysztofa Goczyły) jest wprowadzenie polskiego pojęcia udanowienie jako równoważnego ang. pojęciu datafication o definicji identycznej jak danetyzacja.
Uzasadnieniem jest istnienie takich pojęć podobnych jak:
- ucyfrowienie - cyfryzacja
- umaszynowienie - automatyzacja, robotyzacja
Przypisy:
[1] https://link.springer.com/referenceworkentry/
[2] https://pl.wikipedia.org/wiki/Dokument_elektroniczny
[3] https://www.lexico.com/definition/digitization
[4] https://www.collinsdictionary.com/dictionary/english/digitalization
[5] https://www.gartner.com/en/information-technology/glossary/digitalization
[6] https://workingmouse.com.au/innovation/digitisation-digitalisation-digital-transformation/
[8] https://zjazdfilozoficzny.kul.pl/events/danetyzacja-implikacje-epistemologiczne/