Semalt Expert: Hur man extraherar text från webbsidor

Medan det finns skrapverktyg där ute som kan extrahera data från flera sidor på några sekunder, har det säkra sättet att extrahera text från webbsidor alltid markerat och kopierat texten. Men den här metoden är ganska besvärlig, särskilt i fall där du måste kopiera text från flera sidor. Dessutom kommer webbutvecklare med hjälp av att låsa in en webbsida innehåll för att förhindra "kopiera" det.

"För att börja med finns det olika snabba metoder för att extrahera text från webbsidor. Beroende på hur mycket text du vill få kan du välja mellan följande lägen:

1. Spara-metod

Den här tekniken bygger på webbläsarnas möjlighet att spara en kopia av den aktuella webbsidan lokalt. För att göra det håller du bara kontroll + S-knapparna ihop eller så kan du högerklicka på sidan och välja spara sidan från popup-menyn. Detta startar ett explorerfönster som kräver att du anger vissa attribut på webbsidan.

I det nedre avsnittet finns ett "filnamn" -alternativ som ger dig möjlighet att ange namnet på webbsidafilen. Det är viktigt att notera att webbläsaren också skapar en mapp med ett liknande namn som kommer att innehålla alla bifogade data från webbsidan, t.ex. bilder och bakgrunder.

Under det finns alternativet "spara som typ" som låter dig ange vilken filtyp du vill spara som. Med tanke på att vi är intresserade av text väljer du bara spara som ".txt" som automatiskt skapar en textfil som innehåller all webbsidans text och kan redigeras med valfri ordbehandlare. Den här metoden är särskilt användbar i scenarier där du måste kopiera hela sidor. Om du behöver utelämna vissa delar av texten, öppna bara textfilen och klipp ut den onödiga texten.

2. Ctrl + C och Ctrl + V-metoden

Detta är förmodligen det äldsta tricket i boken, genom att bara använda musen för att markera texten du vill extrahera kan du sedan fortsätta kopiera den och klistra in den någon annanstans. Den här metoden är användbar när du behöver kopiera utdrag och snabbt använder dem i ett annat dokument.

För att utföra detta måste du bläddra till den del som innehåller texten du behöver, tryck och håll ned vänster musknapp för att växla markören från "navigationsläge" till "markera" -läge. Detta gör att du kan markera texten, för att fortsätta hålla vänster musknapp och flytta markören runt för att markera din text. När du är klar släpper du knappen och högerklickar på texten som du har kopierat för att visa navigeringsmenyn. På den klickar du på alternativet "kopiera" för att kopiera den markerade texten.

Navigera till textdokumentet där du vill spara texten och högerklicka för att dyka upp menyn och klicka på klistra in.

Det är viktigt att notera att du kan välja mellan olika klistermoder men om du bara är intresserad av text klickar du på klistra in som vanlig text.

mass gmail