17.05.2021 Rynek medialny
Internet utracony. Badacz UW na tropie polskich stron www z lat 90.
PAP MediaRoom
Tylko 22 proc. polskich adresów URL skatalogowanych w przewodniku z 1997 r. jest jeszcze dostępnych. A prawie 80 proc. zasobów przetrwało jako kopie w archiwach Webu - wynikło z badań Marcina Wilkowskiego z Centrum Kompetencji Cyfrowych Uniwersytetu Warszawskiego.
Marcin Wilkowski z UW, doktorant Instytutu Badań Literackich PAN, zbadał stan zachowania zasobów polskiego internetu z 1997 roku. Przeanalizował 951 adresów URL, skatalogowanych i opisanych w wydanym w 1997 roku, drukowanym przewodniku "Polish World" autorstwa Martina Miszczaka.
- Współcześnie dostępnych jest jedynie niecałe 22 proc. z nich. W archiwach Webu istnieją kopie prawie 80 proc. badanych linków, przy czym ani współczesna dostępność, ani obecność w archiwum Webu nie gwarantuje, że możemy korzystać z oryginalnej postaci strony WWW z początków 1997 roku- podsumowuje Wilkowski w przesłanym PAP komunikacie o swoich badaniach.
Wyniki jego pracy ukazały się w czasopiśmie naukowym "Archiwa - Kancelarie - Zbiory". Wilkowski tłumaczy, że badania historycznego Webu z wykorzystaniem drukowanych przewodników z lat 90. były już podejmowane, przy czym jest to pierwsze takie badanie dla polskiej domeny krajowej.
- Ponieważ nie możemy skorzystać z indeksu wszystkich stron WWW dostępnych w określonym czasie, chcąc sprawdzić, ile z nich wciąż jest dostępnych, musimy szukać innych źródeł informacji. Obok drukowanych katalogów i przewodników są nimi katalogi internetowe, popularne przed tym, jak Google zdominowało sposób wyszukiwania w Internecie, czasopisma, w których publikowano recenzje stron WWW czy artykuły naukowe, gdzie linki do zasobów internetowych umieszczano w przypisach - zwraca uwagę Marcin Wilkowski.
Badacze dawnego internetu korzystać mogą niekiedy z indeksów i zasobów archiwów Webu, serwisów na bieżąco gromadzących kopie stron WWW i agregujących dane na ich temat. Archiwa takie powstają od połowy lat 90. - największe z nich tworzone jest przez amerykańską fundację Internet Archive, chociaż większość z nich prowadzona jest przez biblioteki i archiwa narodowe.
- W Polsce takie archiwum nie funkcjonuje, chociaż podejmowano próby jego zainicjowania - badacze polskiej domeny krajowej muszą więc korzystać z zasobów Internet Archive, chociaż archiwum to zabezpiecza zasoby internetowe bez wyraźnego planu, dość przypadkowo, często także na żądanie użytkowników - każdy może zgłosić tam link do zabezpieczenia - tłumaczy autor badań.
Badanie stron WWW skatalogowanych w "Polish World" to próba rozpoznania wielkości straty związanej z niedostępnością i zmiennością zasobów polskiej domeny krajowej.
W ocenie Wilkowskiego stabilność zasobów WWW jest kluczowa, choćby w badaniach i komunikacji naukowej czy polityce informacyjnej instytucji rządowych. "Niska współczesna dostępność polskich stron z połowy lat 90. nie jest wyjątkiem wobec dostępności zasobów z innych domen - wyjątkowa jest sytuacja, w której osoby zainteresowane korzystaniem z polskich zasobów z przeszłości nie mogą skorzystać z polskiego archiwum, profesjonalnie gromadzącego i udostępniającego kopie stron.
Dbałość o stabilność i zachowanie domeny krajowej może być uznane za część suwerenności technologicznej. Jest to szczególnie ważne współcześnie, wobec sytuacji, w której media społecznościowe współtworzą debatę publiczną, a instytucje państwa, kultury i nauki masowo korzystają z nich informując o swoich działaniach i komentując bieżące wydarzenia" - zwraca uwagę autor.
PRZERWA NA REKLAMĘ
Zobacz artykuły na podobny temat:
Wpływ pandemii na media i informacje. Vibrant Information Barometer
PAP MediaRoom
W opracowanym przez IREX badaniu Vibrant Information Barometer (VIBE) za rok 2021 przeanalizowano kilka czynników związanych z pandemią COVID-19 - globalne pogorszenie się koniunktury gospodarczej, blokowanie informacji przez rządy i dezinformacja - które miały wpływ na sektor mediów i informacji w 13 państwach na terenie Europy i Eurazji.
Polacy czytają coraz mniej? Niekoniecznie!
Bartłomiej Dwornik
W wojnie o czytelnika prasa wydaje się być już zdaniem wielu medioznawców na pozycji straconej, choć oczywiście nie zniknie całkowicie. Jej głównym rywalem jest internet.
ChatGPT nie zna się na żartach
Ludwika Tomala
Naukowcy z Politechniki Wrocławskiej sprawdzili czy ChatGPT rozumie żarty, wychwytuje błędy językowe, sarkazm i agresję, rozpoznaje spam. Poprosili program o wykonanie ponad 38 tysięcy zadań. Na razie wypada on gorzej niż nowoczesne wyspecjalizowane w tym programy, nie mówiąc już o ludziach.
Podcasty w Polsce. Kim jest statystyczny, polski słuchacz
Agata Staniszewska
Audycje internetowe na żądanie docierają równomiernie do kobiet i mężczyzn, a przy tym są słuchane przez osoby wykształcone - 90% z nich posiada co najmniej wykształcenie średnie, a 47% ma dyplom wyższej uczelni. o kolejne wnioski z drugiej edycji najobszerniejszego badania polskich słuchaczy podcastów przygotowanego przez Tandem Media z Grupy Radiowej Agory.
Walter Niemców się nie boi
Magdalena Wierzchowska, Puls Biznesu
TVN jest silny. Atakujący nas politycy ani Polsat wzmocniony Springerem nam nie zagrożą - uważa Piotr Walter, prezes TVN.
Polscy internauci nie chcą płacić za dostęp do treści w sieci
Newseria Biznes
Ponad 80 proc. Polaków korzystających z internetu uważa, że treści dostępne w sieci powinny być bezpłatne, a 22 proc. jest gotowych płacić, ale za ograniczenie liczby wyświetlanych reklam – wynika z raportu Polskiego Instytutu Ekonomicznego.
To ostatni dzwonek, żeby zadbać o polską szkołę [OPINIA]
Reporterzy.info wspierają
Skończmy z masowym rozdawaniem coraz mniej wartych matur i przestańmy próbować kształcić ludzi na pracowników fabryk. Oceniajmy szkoły przez pryzmat atrakcyjności oferty, pozwólmy uczyć przedmiotów zawodowych porządnie i przede wszystkim zadbajmy o tych nauczycieli, którzy jeszcze zostali przy tablicach.