LJSear.ch - en service for dem, der har brug for filerne "Live Journal"
Webtjenester / / December 24, 2019
Vil du finde i "Lær" århundrede gamle rekord, men kan ikke, fordi søgemulighederne er begrænset til en måned? Du vil frigøre tjeneste LJSear.ch, Som indeholder de arkiver russisk-sproget LiveJournal for perioden 2000-2015. Tal om det sit ophav Roman Ivanov (kukutz).
Roman Ivanov
Product Manager i "Yandex". Har lanceret en blog søgning, personlig søgning "Yandex", flere versioner af "Yandex. Mail "tjenester" Yandex. Lenta "" Ya.ru "" Yandex. Billeder "og flere andre. Det er nu engageret i "Yandex. Browser "og LJSear.ch.
Hvad er LJSear.ch?
"Lær" Dette er mere end en terabyte arkiver. Indekseret og tilgængelige for søgning 340 millioner indlæg og kommentarer 1 milliard fra 2000 til efteråret 2015. Og alt dette med det velkendte til blog søgeværktøjer: Begræns efter forfatter, efter dato, af fællesskabet.
Nye poster er ikke indekseret, da vi mener vores projekt som et arkiv, mindesmærke.
Projektet er helt non-profit, ingen reklamer, og andre måder at tjene penge ikke er beregnet til.
Hvorfor har jeg brug for service?
I efteråret søgen 2015 kapacitet til blogs "Yandex" var begrænset til kun sidste måned. Forklaringen var enkel: det store flertal af mennesker er på udkig efter oplysningerForbundet med de seneste optegnelser, og dyb søgen efter dem er overflødige.
Det er sandt. Sidste måned er nok for opgaver såsom regelmæssig overvågning eller en forfængelighed søgning af nogle af de seneste begivenheder. Men der er et problem og dybere forskning.
Jeg tror, at i "Lær" skete, eller i det mindste blev afspejlet næsten alle russisktalende kultur af nul år. Værdien af dette arkiv kan ikke overvurderes. Når "Yandex" har lukket arkiv søgning, er jeg meget skuffet, fordi overbevist om, at denne samling af oplysninger skal opbevares for menneskeheden. Nå og jeg spurgte, "Yandex" arkiver, og han pludselig aftalt og gav dem.
Arkiv Blog helt unik, fordi så meget kan ikke downloades i "Lær". Mange magasiner fjernes ved deres forfattere, nogle brudt og ødelagt af hackere, i nogle tilfælde, optegnelser slettes ikke, men skjult under lås og slå.
De sidste seks måneder på jeg var ansvarlig for at sikre, at data ikke går tabt. Jeg opfordrede hjælp fra venner, og blandt dem var der dem, som indvilligede i at hjælpe med at forstå, om vi kan gøre oplysningerne tilgængelige for søgning. Vi har skabt en tjeneste LJSear.ch og tilsyneladende kørte ham til en fornuftig tilstand.
Frivillige var mange?
Blev fundet. En anerkendt ekspert på området for UX Kohl Zayarny Jeg kom op med designet. Sasha Belyanskiy Jeg tog BEM-vorstku og frontend på Node.js. Spaceinvaderz engageret systemisk indgivelse. Backend programmering i PHP Jeg startede på grundlag af prototypen selv, hvilket gjorde min ven tobe.
Det største problem var jernet: hvem skal betale for hosting? Venner sikker på at du kan indsamle penge til kraudfandingovyh steder, men jeg var skeptisk. Og der er vidunderlige mennesker kom til os fra Servers.ru og tilbød at hjælpe. Som et resultat, har vi en stor dedikeret server med SSD at indeksere og søge backend plus sky virtuel server til frontend.
Hvem kan være interesseret i projektet?
Efterhånden som nye oplysninger ikke er indekseret, publikum, som jeg regner - er forskere. Hvor bogstaveligt forskere kulturelle lag af nul år, og en aktuel eller tidligere brugere "Lær", der ønsker at finde noget, der blev skrevet i disse år. Og fordi jeg ikke begrænse den maksimale gennemførelsestid søgninger: investigator kan vente på komplekse forespørgsler og minutter, og to. Selvfølgelig er simple forespørgsler udføres hurtigt, og hvis tjenesten registrerer, at forespørgslen er nu en masse, det indeholder en kontrolleret nedbrydning, herunder grænser timeout anmodning.
LJSear.ch →