Możliwości zastosowania sztucznej inteligencji i blockchain w działalności archiwalnej. Przegląd doświadczeń zagranicznych

Robert Stępień

Abstrakt

W artykule przedstawiono możliwości zastosowania technologii sztucznej inteligencji oraz blockchain w działalności archiwalnej. Przedmiotem analizy były wyniki projektów badawczych realizowanych w ostatnich latach z udziałem zagranicznych archiwów. Tekst artykułu powstał w oparciu o przegląd anglojęzycznej literatury przedmiotu. Szczególną uwagę zwrócono na informacje zawarte w raportach i sprawozdaniach z badań poświęconych problematyce wykorzystania nowych technologii na gruncie archiwalnym. Przedstawione w artykule przykłady dowodzą, że sztuczna inteligencja i blockchain znajdują zastosowanie w różnych obszarach działalności współczesnych archiwów. Technologie na nich oparte mają potencjał, aby zautomatyzować procesy wartościowania i selekcji dokumentacji elektronicznej oraz wspierać identyfikację danych wrażliwych zawartych w e-dokumentach. Innym polem ich zastosowania są systemy wyszukiwania i udostępniania materiałów archiwalnych w postaci cyfrowej, jak też platformy do rozpoznawania tekstu i struktury dokumentów historycznych. Blockchain, czyli technologia rozproszonego rejestru i łańcuchów blokowych, pozwala zachować integralność i autentyczność obiektów cyfrowego dziedzictwa archiwalnego.

Possibilities of using artificial intelligence and blockchain in archival activities. Review of international experiences

The article presents the possibilities of using artificial intelligence and blockchain technology in archival activity. The analysis covers results of research projects carried out in recent years with participation of foreign archives. The text of the article is based on a review of literature available in English. Particular attention was given to information contained in research reports devoted to application of new technologies in archival work. The examples presented in the article prove that artificial intelligence and blockchain are used in various areas of activity of modern archives. Technologies based on them have the potential to automate the processes of evaluation and selection of electronic documents and to support identification of sensitive data contained in e-documents. Another possible field of application for such technologies are the systems for searching and accessing archival materials in digital form, as well as platforms for recognition of text and structure of historical documents. Blockchain, or distributed ledger and blockchain technology, preserves the integrity and authenticity of digital archival heritage objects.

Słowa kluczowe: archiwistyka, informatyka, sztuczna inteligencja, blockchain, dokument elektroniczny, archiwa cyfrowe, archival sciences, informatics, artificial intelligence, electronic document, digital archives
References

Consultative Committee for Space Data Systems, Audit and Certification of Trustworthy Digital Repositories. Recommended Practice, CCSDS 652.0-M-1, 2011, https://public.ccsds.org/pubs/652x0m1.pdf [dostęp: 30.05.2021].

Consultative Committee for Space Data Systems, Reference Model for an Open Archival Information System (OAIS). Recommended Practice, CCSDS 650.0-M-2, 2012, https://public.ccsds.org/pubs/650x0m2.pdf [dostęp: 30.05.2021].

Online Computer Library Center, Center for Research Libraries, Trustworthy Repositories Audit & Certification: Criteria and Checklist, version 1.0, 2007, https://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf [dostęp: 30.05.2021].

Public Records Act 1973, No. 8418/1973, Authorised Version No. 041.

Research Libraries Group, Online Computer Library Center, Trusted Digital Repositories: Attributes and Responsibilities, 2002, https://prd-wret.s3.us-west-2.amazonaws.com/assets/palladium/production/atoms/files/repositories-1.pdf [dostęp: 30.05.2021].

The National Archives, Archives Inspire: The National Archives Plans and Priorities 2015–19, https://www.nationalarchives.gov.uk/documents/archives-inspire-2015-19.pdf [dostęp: 30.05.2021].

The National Archives, Digital Strategy, https://www.nationalarchives.gov.uk/documents/the-national-archives-digital-strategy-2017-19.pdf [dostęp: 30.05.2021].

The National Archives, The Application of Technology-Assisted Review to born-digital records transfer, Inquiries and beyond, Research Report, Published: February 2016, https://www. nationalarchives.gov.uk/documents/technology-assisted-review-to-born-digital-records-transfer.pdf [dostęp: 30.05.2021].

The National Archives, The Digital Landscape in Government 2014–15, Business Intelligence Review, Published: February 2016, https://www.nationalarchives.gov.uk/documents/digital-landscape-in-government-2014-15.pdf [dostęp: 30.05.2021].

Zalecenia UNESCO w sprawie zachowania i dostępu do dziedzictwa dokumentacyjnego, w tym dziedzictwa cyfrowego (2015), red. T. Komorowski et al., Warszawa 2016.

Bibliografia

Allan R., Virtual Research Environments. From Portals to Science Gateways, Oksford 2009.

Angelova L. et al., Deep Discoveries. Interim Report. Foundation Projects, 2020, https://www. nationalcollection.org.uk/sites/default/files/2021-02/Deep%20Discoveries.pdf [dostęp: 30.05.2021].

Angelova L., Fulton L., Deep Discoveries: A new way of exploring and connecting digitised image collections, The National Archives, 13.05.2020, https://blog.nationalarchives.gov.uk/deep-discoveries-exploring-a-new-way-of-discovering-and-connecting-digitised-collections/ [dostęp: 30.05.2021].

Bak G., Digital Repository, [w:] Encyclopedia of Archival Science, red. L. Duranti, P.C. Franks, Lanham 2015, s. 170–173.

Banerjee K., Anderson M., Batch Metadata Assignment to Archival Photograph Collection Using Facial Recognition Software, „Code4Lib Journal” 2013, t. 21, https://journal.code4lib.org/ articles/8486 [dostęp: 30.05.2021].

Bell M. et al., Underscoring Archival Authenticity with Blockchain Technology, „Insights” 2019, t. 32, https://insights.uksg.org/articles/10.1629/uksg.470/ [dostęp: 30.05.2021].

Bomba R., Bazo-danowe interfejsy. Projektowanie interakcji z dużymi zasobami danych kulturowych, „Kultura Popularna” 2017, nr 1, s. 64–73.

Bower J.L., Christensen C.M., Disruptive Technologies: Catching the Wave, „Harvard Business Review” 1995, t. 73, nr 1, s. 43–53.

Bui T. et al., ARCHANGEL: Tamper-proofing Video Archives using Temporal Content Hashes on the Blockchain, [w:] Proceedings IEEE CVPR Workshop on Computer Vision AI and Blockchain, 2019, https://arxiv.org/pdf/1904.12059.pdf [dostęp: 30.05.2021].

Christensen C.M., Przełomowe innowacje. Możliwości rozwoju czy zagrożenie dla przedsiębiorstwa, przeł. H. Simbierowicz, Warszawa 2010.

Christensen C.M., The Innovator’s Dilema: When New Technologies Cause Great Firms to Fail, Harvard Business School Press, Boston 1997.

Collomosse J., ARCHANGEL: Trusted Archives of Digital Public Documents, [w:] DocEng ‘18: Proceedings of the ACM Symposium on Document Engineering 2018, Halifax, Nova Scotia, Canada, https://arxiv.org/pdf/1804.08342.pdf [dostęp: 30.05.2021].

Dunley R., Machines reading the archive: handwritten text recognition software, The National Archives, 19.03.2018, https://blog.nationalarchives.gov.uk/machines-reading-the-archive-handwritten-text-recognition-software/ [dostęp: 30.05.2021].

Findlay C., Participatory Cultures, Trust Technologies and Decentralisation: Innovation Opportunities for Recordkeepping, „Archives and Manuscripts” 2017, t. 45, nr 3, s. 176–190.

Flach P., Machine Learning. The Art and Science of Algorithms that Make Sense of Data, Cambridge 2012.

Goudarouli E., Sexton A., Sheridan J., The Challenge of the Digital and the Future Archive: Through the Lens of The National Archives UK, „Philosophy & Technology” 2019, t. 32, nr 1, s. 173–183.

Głomb K. et al., Kompetencje cyfrowe w czasach cyfrowej dysrupcji. Studium wyzwań dla Polski w perspektywie roku 2030, Warszawa 2019, https://www.mwi.pl/uploads/filemanager/publikacje/Kompetencje--przysz%C5%82o%C5%9Bci--w--czasach--cyfrowej--dysrupcji--studium--2019%2C%20final%2C%207.02.2018.pdf [dostęp: 30.05.2021].

Green A., Trustworthy technology: the future of digital archives, The National Archives, 05.06.2018, https://blog.nationalarchives.gov.uk/trustworthy-technology-future-digital-archives/ [dostęp: 30.05.2021].

Hampton W.M., Predictive Coding: It’s Here to Stay, „E-Discovery Bulletin” June/July 2014, https://files.skadden.com/sites%2Fdefault%2Ffiles%2Fpublications%2Flit_junejuly14_
ediscoverybulletin.pdf [dostęp: 30.05.2021].

Hutchinson T., Natural Language Processing and Machine Learning as Practical Toolsets for Archival Processing, „Records Management Journal” 2020, t. 30, nr 2, s. 155–174.

Izdebski K., Algorytmy w procesie podejmowania decyzji urzędowych, „IT w Administracji” 2019, nr 9 (142), s. 24–28.

Januszko-Szakiel A., Archiwistyka cyfrowa. Długoterminowa ochrona dziedzictwa nauki i kultury, Warszawa 2017.

Januszko-Szakiel A., Wiarygodność archiwów cyfrowych, „Przegląd Biblioteczny” 2009, t. 77, z. 3, s. 325–347.

Knapińska A., Soft power czy relikt przeszłości. Publiczne finansowanie humanistyki w Stanach Zjednoczonych Ameryki i Wielkiej Brytanii, [w:] Systemy publicznego finansowania nauki w ujęciu międzynarodowym, Warszawa 2016, s. 79–96.

Kuziemski M., Misuraca G., AI Governance in the Public Sector: Three Tales from the Frontiers of Automated Decision-Making in Democratic Settings, „Telecommunications Policy” 2020, t. 44, nr 6, s. 1–13, https://www.sciencedirect.com/journal/telecommunications-policy/vol/44/issue/6 [dostęp: 30.05.2021].

Laszuk A. (rec.), Encyclopedia of Archival Science, edited by Luciana Duranti, Patricia C. Franks, Rowman & Littlefield, 2015, ss. X+454, „Archiwista Polski” 2017, nr 1–2, s. 93–104.

LeSueur A., Robot Government: Automated Decision-Making and its Implications for Parliament, [w:] Parliament: Legislation and Accountability, red. A. Horne, A. Le Sueur, Oksford 2016, s. 183–202.

Lem S., Bomba Megabitowa, posł. J. Jarzębski, Kraków 1999.

Mackenzie F., How to teach a computer to read, The National Archives, 13.05.2019, https://blog.nationalarchives.gov.uk/how-to-teach-a-computer-to-read/ [dostęp: 30.05.2021].

McDonald G., Macdonald C., Ounis I., How Sensitivity Classification Effectiveness Impacts Reviewers in Technology-Assisted Sensitivity Review, [w:] CHIIR ’19: Proceedings of the 2019 Conference on Human Information Interaction and Retrieval, Glasgow 2019, s. 337–341, http://eprints.gla.ac.uk/174446/7/174446.pdf [dostęp: 30.05.2021].

Muehlberger G. et al., Transforming Scholarship in the Archives Through Handwritten Text Recognition. Transkribus as a Case Study, „Journal of Documentation” 2019, t. 75, nr 5, s. 954–976.

Müller J., Digital Transformation at Media Archives: Ten Steps to Becoming Digital by Design, „Journal of Digital Media Management” 2020, t. 8, nr 4, s. 321–339.

Narojczyk K., Technologia rozpoznawania twarzy w warsztacie badawczym historyka, [w:] Multimedia a źródła historyczne w nauczaniu i badaniach, red. M. Ausz, M. Szabaciuk, Lublin 2014, s. 273–294. 

Nawrocki S., Doświadczenia zagraniczne w zakresie stosowania komputera w archiwach, „Biuletyn Informatyka i Archiwa” 1978, nr 11, s. 6–33 (tekst w nieco zmienionej postaci został opublikowany w czasopiśmie „Archeion” 1982, t. 74, s. 5–26).

Oard D.W. et al., Evaluation of Information Retrieval for E-discovery, „Artificial Intelligence and Law” 2010, t. 18, s. 347–386.

Oliver G. et al., Recordkeeping Informatics for a Networked Age, Clayton, Wiktoria 2018.

Open Data Institute, The National Archives, University of Surrey, ARCHANGEL: guaranteeing the integrity of digital archives. Project Report, 2019, https://theodi.org/wp-content/uploads/2019/08/2019-08-ARCHANGEL_-digital-artchive-integrity-Open-Data-Institute.pdf [dostęp: 30.05.2021].

Pepłowska K., Archiwa cyfrowe w wybranych krajach europejskich, USA i Australii, Biblioteka Zarządcy Dokumentacji, t. 8, Toruń 2017.

Perzyna P., Problemy terminologiczne wynikające z komputeryzacji archiwów, [w:] Komputeryzacja i digitalizacja w archiwach, Symposia Archivistica, t. 2, red. R. Leśkiewicz, A. Żeglińska, Warszawa 2016, s. 47–69.

Pieriegud J., Cyfryzacja gospodarki i społeczeństwa – wymiar globalny, europejski i krajowy, [w:] Cyfry- zacja gospodarki i społeczeństwa. Szanse i wyzwania dla sektorów infrastrukturalnych, red. J. Gajewski, W. Paprocki, J. Pieriegud, Gdańsk 2016, s. 11–37.

Raport o archiwach Unii po rozszerzeniu: pogłębiona współpraca archiwalna w Europie – plan działania, oprac. przez Grupę Ekspertów Krajowych ds. Archiwów Państw Członkowskich Unii Europejskiej oraz Instytucji i Organów UE na zamówienie Rady Unii Europejskiej, red. nauk. A. Biernat, W. Stępniak, V. Urbaniak, tł. J. Szymańska, Warszawa 2012.

Redzisz M., Piłsudski z czarnej skrzynki, Sztuczna inteligencja 23.03.2020, https://www.sztucznainteligencja.org.pl/pilsudski-z-czarnej-skrzynki/ [dostęp: 30.05.2021].

Renade S., Access Technologies for the Disruptive Digital Archive, [w:] Archival Futures, red. C. Brown, Londyn 2018, s. 79–98.

Rolan G. et al., More Human than Human? Artificial Intelligence in the Archive, „Archives and Manuscripts” 2019, t. 47, nr 2, s. 179–203.

Saaman E., Archiving by design, National Archives of the Netherlands, https://www.nationaalarchief.nl/en/archive/knowledge-base/archiving-by-design [dostęp: 30.05.2021].

Seles A., A Brave New World: Artificial Intelligence and Archives (referat przedstawiony na konferencji „Archives Today and Tomorrow: Prospering as a Diversity of Records Dramatically Increase”, zorganizowanej w 2019 r. przez Archiwum Narodowe Japonii oraz oddział regionalny Międzynarodowej Rady Archiwów dla Azji Wschodniej – EASTICA), http://www.archives.go.jp/english/news/pdf/20191125_27e_01.pdf oraz http://www.archives.go.jp/english/news/pdf/20191125_27e_02.pdf [dostęp: 30.05.2021].

Schneider J. et al., Appraising, Processing, and Providing Access to Email in Contemporary Literary Archives, „Archives and Manuscripts” 2019, t. 47, nr 3, s. 305–326.

Theimer K., Digital Archives, [w:] Encyclopedia of Archival Science, red. L. Duranti, P.C. Franks, Lanham 2015, s. 157–159.

Torczyńska M., Sztuczna inteligencja i jej społeczno-kulturowe implikacje w codziennym życiu, „Kultura i Historia” 2019, nr 36, s. 106–126.

Vellino A., Alberts I., Assisting the Appraisal of E-mail Records with Automatic Classification, „Records Management Journal” 2016, t. 26, nr 3, s. 293–313.

Wasiuta O., Wasiuta S., Deepfake jako skomplikowana i fałszywa rzeczywistość, „Annales Universitatis Paedagogicae Cracoviensis. Studia de Securitate” 2019, nr 9 (3), s. 19–30.

Whitelaw M., Generous Interfaces for Digital Cultural Collections, „Digital Humanities Quarterly” 2015, t. 9, nr 1, http://www.digitalhumanities.org/dhq/vol/9/1/000205/000205.html [dostęp: 30.05.2021].

Zaręba T., Self aware networks – cechy techniczne i implikacje technologiczne, [w:] Cyfryzacja gospodarki i społeczeństwa. Szanse i wyzwania dla sektorów infrastrukturalnych, red. J. Gajewski, W. Paprocki, J. Pieriegud, Gdańsk 2016, s. 75–90. 

Netografia

ARCHANGEL, https://www.archangel.ac.uk/ [dostęp: 30.05.2021].

European Commission. A European Approach to Artificial Intelligence, https://ec.europa.eu/digital-single-market/en/artificial-intelligence [dostęp: 30.05.2021].

InterPares Trust, https://interparestrust.org [dostęp: 30.05.2021]. Nuix, https://www.nuix.com/ [dostęp: 30.05.2021].

Public Record Office Victoria. Email appraisal, disposal and preservation, https://prov.vic.gov.au/recordkeeping-government/research-projects/email-appraisal-disposal-preservation-project [dostęp: 30.05.2021].

READ (Recognition and Enrichment of Archival Documents), https://readcoop.eu/ [dostęp: 30.05.2021].

Recordkeeping Roundtable. Recordkeeping Roundacts Episode 3: Machine learning (rozmowa z Johnem Sheridanem, dyrektorem ds. cyfrowych w The National Archives, na temat uczenia maszynowego i jego możliwych zastosowań), https://rkroundtable.org/2018/08/19/recordkeeping-roundcasts-episode-3-machine-learning/ [dostęp: 30.05.2021].

Records Management Journal, https://www.emerald.com/insight/publication/issn/0956-5698 [dostęp: 30.05.2021].

Surrey Blockchain, https://blockchain.surrey.ac.uk/index.html [dostęp: 30.05.2021].

Serwis Rzeczypospolitej Polskiej. Droga do polskiej strategii AI, https://www.gov.pl/web/ cyfryzacja/droga-do-polskiej-strategii-ai [dostęp: 30.05.2021].

Towards a National Collection, https://www.nationalcollection.org.uk/ [dostęp: 30.05.2021].

United Nations. Department of Economic and Social Affairs. Public Institutions, https://publicadministration.un.org [dostęp: 30.05.2021].

YouTube. Dokument elektroniczny w archiwum – dzień I (nagranie z konferencji „Dokument elektroniczny w archiwum. Metody postępowania, dobre praktyki i techniki zarządzania”), https://www.youtube.com/watch?v=9R3EPGZvkUY&t=23720s [dostęp: 30.05.2021].

Pierwotną wersją czasopisma jest wersja elektroniczna publikowana w Internecie.