Hvordan man kan fastslå, at teksten er skrevet af et neuralt netværk
Miscellanea / / August 21, 2023
Kunstig intelligens er en god assistent på mange områder. Men du skal ikke stole ubetinget på ham.
Ved data Bloomberg, omkring 30% af specialister bruger neurale netværk til at generere tekst. I Rusland, 67% af de adspurgte ønsker at ansøge i arbejdet med kunstig intelligens for at arbejde mindre og ikke miste indkomst. Det er bare sådan en statistik, der ikke alle kunder glæder sig over. Nogle har ikke tillid til neurale netværk, så de foretrækker, at tekster ikke er skrevet af robotter, men af mennesker.
Vi forstår, hvorfor kunder er på vagt over for teknologier, og hvilke midler der findes til at afsløre neurotekster i dag.
Hvorfor tekster fra neurale netværk skal behandles med forsigtighed
Her er hovedårsagerne til, at kunder er på vagt over for sådanne artikler.
Risiko for krænkelse af ophavsretten
I dag er der ingen officiel holdning til spørgsmålet om hvem tilhører ophavsret til tekster oprettet ved hjælp af AI. Ifølge loven er en forfatter en person, der skaber et værk ved kreativt eller intellektuelt arbejde. Dog i tilfælde af
neurale netværk folk giver kun instruktioner, men skriver ikke selv.Da loven nu ikke anerkender neurotekster som genstande for ophavsret, er reglerne for brug af indhold genereret af teknologier bestemt i brugeraftalen for det neurale netværk.
Og hvis Open AI sender rettigheder til teksten selv i den gratis version, så Gerwin grænser dets brug til politiske, diskriminerende formål eller i ugunstige reklamer. Og i midt på rejsen bruge indholdet til kommercielle formål Kan kun hvis produktet er genereret til en betalt sats.
Risiko for at få ikke-unik eller unøjagtig information
Det neurale netværk modtager en anmodning, sender den gennem algoritmer, analyserer de tilgængelige oplysninger om emnet og giver et svar. Uden at benægte, at den samme anmodning fra en anden bruger kan producere en lignende eller lignende tekst.
Og her kommer en ny fare. Forskere ved Cornell University kom frem til konklusion: hvis svarene fra det neurale netværk på det samme spørgsmål varierer meget, så kommer det med stor sandsynlighed med fakta.
Risikoen for, at neurotekster sænker virksomhedens ressource i søgeresultaterne
I slutningen af sidste år, Google kvalitetsspecialist Duy Nguyen erklæretat virksomheden har algoritmer på plads til at opdage og nedgradere oprettet indhold kunstig intelligens. Derfor frygter mange, at søgemaskiner vil lede efter sådant indhold og pessimisere det. Altså at sænke positionen i søgeresultaterne.
Fortilfældene eksisterer allerede. For eksempel brugte marketingmedarbejder Neil Patel eksperimentved at lave 50 testhjemmesider, som han delte op i to grupper. Eksperten fyldte webstederne i den første del med artikler skabt udelukkende af kunstig intelligens. Webstederne for den anden hostede AI-artikler modificeret af mennesker, såvel som materialer skrevet af tekstforfattere uden brug af neurale netværk.
Resultaterne af eksperimentet viste, at ressourcerne i den første gruppe mistede flere positioner i søgeresultaterne. Og det førte til formindske trafik op til 70 %.
Samtidig tilføjede Google-repræsentanter, at de har en positiv holdning til udviklingen af neurale netværk og allerede har skabt deres egne Chatbot Bard. Men for virksomheden er kvalitetstekster en prioritet. Systemet, som rangerer resultaterne, tilbyder først og fremmest brugere materialer, der opfylder standarder E‑E‑A‑T (erfaring, kompetence, troværdighed, troværdighed).
Tekster, der svarer til dem, vækker tillid og anses for nyttige, fordi de indeholder eksempler, erfaring, en analytisk del og forskning. Og det indhold, som neurale netværk skaber, uden yderligere dyb raffinement af en person, er ofte ikke sådan.
I mellemtiden i Statsdumaen foreslået indføre mærkning af materialer skabt ved hjælp af kunstig intelligens. Indtil det sker, skal du bestemme, at teksten genereret af et neuralt netværk, bliver nødt til at gøre det selv. Eller ved hjælp af særlige tjenester.
Hvordan man selvstændigt bestemmer, at teksten er skrevet af et neuralt netværk
MIREA Technological University afholdt for nylig eksperiment, hvor 20 lærere og over 200 elever deltog. Halvdelen af dem skrev videnskabelige artikler på egen hånd. Og de øvrige 50 % brugte hjælp fra neurale netværk. Lærere skulle derimod beregne sådanne AI-materialer.
For at gøre dette var lærerne opmærksomme på tekstens stilistiske og ortografiske træk. For eksempel for et stort antal gentagne ord og betydninger, faktiske og logiske fejl, mangel på originale domme. På denne måde var lærerne i stand til at identificere 96 % af arbejdet skrevet ved hjælp af det neurale netværk. 4 % af de studerende, der ikke blev eksponeret, indrømmede, at de brugte mange timer på at redigere AI-tekst.
Der er ingen universel instruktion, der hjælper med at beregne teksten, der genereres af det neurale netværk. Forsøget viser imidlertid, at lignende mønstre er iboende i sådanne materialer. Lad os overveje dem mere detaljeret.
Gentagelser af betydninger og ord
En af grundene til, at et websted bliver sænket i søgeresultaterne, er genoptimering af søgeord. Det neurale netværk som svar på en anmodning "svarer ofte i en cirkel". Nogle gange bruger hun forskellige forekomster, men betydningen gentages stadig.
Så i skærmbilledet nedenfor fik kunstig intelligens til opgave at skrive et salgsindlæg om en ny, skånsom måde at farve hår på. Og i en lille tekst gentog det neurale netværk gentagne gange de samme teser.
Næsten hver sætning genereret tekst sætningen "en ny måde at farve" gentages. Og der er også en gentagen duplikering af betydninger om metodens sikkerhed og en individuel tilgang, som vil understrege det unikke ved hver klient.
Her er nogle citater fra teksten, der illustrerer dette: "transformer dit billede og udtryk din individualitet", "tag hensyn til din individualitet", "egnet til dig", "skab for dig unikt og stilfuldt look", "gør din frisure unik", "bevar dit hårs sundhed og glans", "sikkert for dit hår", "pas på dit hår, bevar det sundhed".
I mellemtiden var det nok at nævne en gang, at en ny procedure blev præsenteret i salonen - sparsomt farvningsmetodesom vil holde håret i live. Og forklar også, hvordan metoden virker, hvad er dens nyhed, og hvorfor den er sikker. Og tilføje, at farvepaletten er forskelligartet, og de mestre, der er blevet trænet, vil ikke kun udføre farvning med høj kvalitet, men vil også hjælpe med valget af farve.
Tilstedeværelsen i teksten af et stort antal frimærker og klicheer, manglen på sanseoplevelse
Farveeksemplet viser også, at et neuralt netværk ikke kan efterligne, hvordan en person taler i det virkelige liv. Folk forsegler, brug slang og forkortelser, bevidst forvrængning af ord. En sådan præsentation hjælper med at tiltrække opmærksomhed, vække følelser, formidle forfatterens position, hans sanseoplevelse.
Forskning vis: det neurale netværk deler ikke følelser, accepterer ikke nogens holdning. Derfor foretrækker han neutralitet, klicheer og klicheer. I eksemplet ovenfor er der tale om "faglige færdigheder", "materialer af høj kvalitet", "unik mulighed".
Samtidig genererer det neurale netværk tekster i forskellige stilarter. Du kan fx give hende til opgave at udarbejde et materiale om emnet ”Hvad påvirker omkostningerne ved olie». Men for at præcisere, at teksten ikke skal skrives i et tørt sprog, men med tilføjelse af metaforer og sammenligninger. Resultatet er dog stadig kunstigt. AI har jo ingen målestok, den "føler" ikke teksten, som en person gør.
1 / 0
2 / 0
Et af afsnittene vil hjælpe med at se, at det opnåede resultat ikke kan sammenlignes med den intonation, der er iboende i en person: "Efterspørgsel og udbud er som en dans af to elskere på oliemarkedet. Hvis efterspørgsel efter olie stiger som et rasende hav, og hvis udbuddet ikke holder trit, stiger priserne som champagne ved en nytårsfest. Men hvis efterspørgslen falder, og udbuddet stiger, så kan priserne falde som en ballon til en børnefest."
Teksten virker kunstig, og de fleste vendinger i den er malplacerede. Og selvom indlægget virkelig viste sig at være "ikke tørt", er det svært at forestille sig, at en ekspert ville have skrevet på denne måde. Derudover er bogstaveligt talt hver sætning en metafor og sammenligning. Sådanne teknikker bør dog være præcise og pænt indlejret i teksten. Ellers vil mening gå tabt bag et overskud af billeder.
Tilstedeværelse af meningsløse sætninger og mangel på logik
Sprogforsker Noam Chomsky bemærker i sin bog Syntactic Structures, at den grammatisk korrekte konstruktion af sætninger i en sætning ikke garanterer tilstedeværelsen af logik og mening. Som et eksempel nævnte eksperten udtrykket farveløse grønne ideer sover rasende - "farveløse grønne ideer sover rasende."
Algoritmer hjælper det neurale netværk med at opbygge korrekte sætninger med hensyn til grammatik. For AI er der dog ikke noget begreb om "mening". Og det kan have sin egen logik for hvert afsnit, da materialet er hentet fra forskellige kilder.
For eksempel blev et neuralt netværk bedt om at generere anmeldelser for en shower gel og træningsdragt. Teksten om tøj blev således: "Ved hjælp af et jakkesæt kan du slappe af, fordybe dig i sportens verden og også gå en tur. Den har temperaturkontrol, takket være hvilken du føler dig godt tilpas i enhver situation.
Og her er en anmeldelse af shower gelen: “Vidunderlig gel, lækker ikke, tynger ikke huden. Pakket i en pose, i en æske, med låg. Ingen grund til at vente på noget ekstra, så det smuldrer lidt. Kan bruges som natbrusegel.
Nogle sætninger i dem godt bygget, men virker samtidig absurd og ligner Chomskys illustration.
Mangel på tekstur og overfladiske eksempler
Kunstig intelligens giver åbenlyse oplysninger i teksterne, generelle fakta, bruger strømlinede sætninger og eksempler, der ikke afslører spørgsmålet meget. I dette tilfælde er kompleksiteten af emnet ligegyldig. Spørgsmålet kan være dybt, såsom udviklingsmuligheder indeslutninger i Rusland. Eller mere enkelt og individuelt, hvad angår valg af teknik.
I teksten om inklusion fortalte det neurale netværk, hvor vigtigt og relevant dette emne er. Hun tilføjede også, at inklusion er en lang proces, ledsaget af vanskeligheder, men der arbejdes på at skabe vilkår for mennesker med særlige behov. Og opsummeret: Hvis du ikke stopper, så vil udvikling helt sikkert være det.
Det, der står, svarer dog ikke på spørgsmålet. Det er vigtigt, at teksten er specifik. Du kan for eksempel analysere, hvilke af de vedtagne love der virker, og hvilke der ikke gør, og hvorfor. At afsløre udenlandske erfaringer. Og forklar hvilke konkrete skridt staten, erhvervslivet og enhver person stadig kan tage for at udvikle inklusion.
I teksten om at købe en smartphonegenereret af det neurale netværk, er de åbenlyse selektionsfaktorer også angivet. For eksempel: du bør beslutte dig for operativsystemet (iOS eller Android), mærke, læse anmeldelser og tekniske specifikationer og også tage hensyn til dine egne muligheder.
1 / 0
2 / 0
Men folk forstår dette. En anden ting er at tale om chips af operativsystemer, for at indikere de begrænsninger, der eksisterer i øjeblikket. Eller nævn innovative løsninger – for eksempel eSIM-teknologi, som giver dig mulighed for at have op til fem numre i én smartphone. Eller del overprisede enhedsmodeller og deres modstykker til den bedste pris.
Fordrejning af fakta, tilføjelse af opfundne informationer
Det neurale netværk besvarer plausibelt næsten ethvert spørgsmål og giver en kronik, datoer, efternavne, oprindelseshistorie. I dette tilfælde er informationen forvrænget eller fuldstændig opfundet. En sådan fejl i arbejdet med AI kaldes en hallucination.
Så det neurale netværk fik til opgave at fortælle om de berømte døvesom ydede et stort bidrag til samfundets udvikling. Som et resultat opfandt AI de fleste af dem.
1 / 0
2 / 0
For eksempel astronaut Raymond Lou eller bokseren Mario Gallegos. Og USA's 42. præsident var stadig ikke Matthew Clinton, men Bill Clinton. Og han mistede ikke hørelsen.
Derudover reagerede AI trygt på anmodningen "skriv et indlæg om kreativt amnesi». Selvom der ikke findes et sådant udtryk.
På spørgsmålet om, hvorfor botten opfinder mennesker og taler om ikke-eksisterende udtryk, undskylder han kun for mulig forvirring.
1 / 0
2 / 0
Når falske fakta er sammenflettet med sande data, er det sværere at opdage neurale netværkshallucinationer. Især når flydende læsning. Men hvis du koncentrerer dig om eksemplerne i teksten, kan du se dem, der ser mistænkelige ud, og tjekke dem ved at skrive dem i søgefeltet.
Mangel på opdateret information om aktuelle ændringer, begivenheder
Neurale netværk lærer selv, når de kommunikerer med brugere, husker en persons afklaringer, hans reaktion på det genererede indhold, eksempler, som en person deler med en bot. Eksperter bemærketat AI's evne til selv at lære kom som en overraskelse for dem. Og at denne færdighed hjælper neurale netværk med at forbedre sig.
Hvori maskinelæring, udført af udviklere på gigabyte data - artikler, bøger, tekster fra nettet - har en klar begyndelse og slutning. Og som udgangspunkt har neurale netværk ikke adgang til søgemaskiner. Derfor er informationen, der dukkede op efter uddannelsen udført af udviklerne, ikke tilgængelig for AI før næste fase.
Samtidig er intervallet mellem maskinlæring måneder og nogle gange år. Selvfølgelig står fremskridtet ikke stille: for eksempel blev GPT Plus i maj i år tilgængelig for brugere med et betalt abonnement ChatGPT med internetadgang. Men de fleste neurale netværk, især deres gratis versioner, har endnu ikke en sådan mulighed.
Så bunden af den gratis version af ChatGPT4 er begrænset til 2021, så botten ved ikke, hvem der vandt det sidste verdensmesterskab i 2022. Og Googles neurale netværk - Bard AI - indrømmede, at det ikke kunne komponere en tekst om væsentlige begivenheder, der fandt sted i verden denne sommer.
1 / 0
2 / 0
Siden hendes sidste træning blev udført af udviklerne i maj 2023, er sommeren endnu ikke ankommet for Bard AI.
I sådanne tilfælde kommer neurale netværk normalt ikke med fakta, men indrømmer, at de ikke kan "forudsige fremtiden».
Hvis teksten ikke indeholder opdaterede oplysninger om emnet, eller den ser adskilt fra virkeligheden, da meget har ændret sig for nylig, så er der en mulighed for, at materialet er skrevet af et neuralt netværk.
Hvilke tjenester kan hjælpe
Teksten genereret af kunstig intelligens kan også genkendes ved hjælp af selve det neurale netværk. Det kan den f.eks bot GPT-4. Særlige tjenester, der kan detektere AI-algoritmer, kan også hjælpe. Lad os se på nogle af dem nedenfor.
- Text.ru. Siden er placeret som en tekstforfatter- og anti-plagiatbørs. Men for nylig dukkede en betalt neuro-assistent op på portalen. En af dens funktioner er en AI-detektor. Den tekst, der skal kontrolleres, skal indlæses i vinduet. Efter et par sekunder vil systemet give resultatet.
- PR CY. Du kan uploade tekster fra 1.000 tegn til tjenesten. Samtidig er der afklaringer på portalen: spam-optioner af lav kvalitet, som en person skrev, vil systemet betragte som et resultat af AI-arbejde. Samt tekster med lyse stilistiske farvelægninger - for eksempel i lighed med værker Majakovskij.
- GPTZero. Værktøjet aflæser kompleksiteten, kombinationen af ord, strukturen og længden af sætninger. Men hvis tjenesten klarer tekster på engelsk godt, giver det ofte en fejl ved indlæsning af russisksproget materiale. Af fordelene - tilstedeværelsen af en gratis version.
Et neuralt netværk kan være en god hjælper. For eksempel når man leder efter ideer. Det er dog farligt at stole fuldstændigt på hendes indhold. Du bør behandle AI-materialer ansvarligt: rediger spam, kontroller for nøjagtighed, logik og relevans af fakta. Og juster stilen til det "menneskelige" sprog, for ikke at skræmme publikum, gem virksomhedens omdømme og position i søgeresultaterne.
Læs også🤖
- 6 grunde til, at du ikke blindt bør stole på kunstig intelligens
- Sådan tilføjer du en bot til Discord
- 6 neurale netværk til at skabe logoer