Hogyan lehet feltérképezni egy nagy webhelyet és kivonni az adatokat a Screaming Frog SEO Spider segítségével

Screaming Frog SEO Spider
Olvasási idő: 3 jegyzőkönyv

Jelenleg több ügyfelet segítünk Marketo migrációk. Mivel a nagyvállalatok ilyen vállalati megoldásokat alkalmaznak, olyan ez, mint egy pókháló, amely évek során folyamatokká és platformokká szövi bele magát ... addig a pontig, hogy a vállalatok még csak nem is ismerik minden érintési pontot.

A Marketo-hoz hasonló vállalati marketing automatizálási platform segítségével az űrlapok az adatok belépési pontját jelentik a webhelyeken és a céloldalakon. A vállalatok gyakran több ezer oldallal és több száz űrlappal rendelkeznek a webhelyeiken, amelyeket a frissítéshez azonosítani kell.

Ehhez remek eszköz az Visító Frog SEO Spider... a piac talán legnépszerűbb platformja a webhely feltérképezéséhez, auditálásához és kinyeréséhez. A platform funkciókban gazdag, és több száz lehetőséget kínál gyakorlatilag minden szükséges feladathoz.

Screaming Frog SEO Spider: Feltérképezés és kivonat

A Screaming Frog SEO Spider egyik legfontosabb jellemzője, hogy ezek alapján egyedi kivonatokat hajthat végre regex, XPathvagy CSSPath sajátosságai. Ez rendkívül hasznos, mivel be akarjuk térképezni az ügyfél webhelyeit, és auditálni és rögzíteni akarjuk a MunchkinID és a FormId értékeket az oldalakról.

Az eszközzel nyissa ki Konfiguráció> Egyéni> Kicsomagolás a kivonni kívánt elemek azonosításához.

screamingfrog egyedi kivonat

A kinyerési képernyő gyakorlatilag korlátlan adatgyűjtést tesz lehetővé:

Screaming Frog SEO Spider kihúzási szabályok

Regex, XPath és CSSPath kibontás

A MunchkinID esetében az azonosító az oldalon található űrlapfájlban található:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Ezután alkalmazzuk a Regex szabály az azonosító rögzítése az oldalon beillesztett szkriptcímkéből:

Regex: ["']id["']: *["'](.*?)["']

Az űrlapazonosító esetében az adatok a Marketo űrlapon lévő bemeneti címkében találhatók:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Alkalmazunk egy XPath szabály hogy rögzítse az azonosítót az oldalon beillesztett űrlapon belül. Az XPath lekérdezés olyan űrlapot keres, amelynek neve van félelmetes, akkor az extrakció menti a érték:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript renderelés

A Screaming Frog másik nagyszerű lehetősége, hogy nem korlátozódik az oldal HTML-jére, hanem megjeleníthet minden olyan JavaScript-et, amely űrlapokat fog beilleszteni a webhelyére. Belül Konfiguráció> Pók, akkor lépjen a Rendering fülre, és engedélyezze ezt.

Screaming Frog SEO Spider Javascript renderelés

Természetesen egy kicsit hosszabb ideig tart a webhely feltérképezése, de kap olyan formanyomtatványokat, amelyeket a kliens oldallá tesz a JavaScript, valamint a kiszolgálóoldali beillesztett űrlapokat.

Bár ez egy nagyon specifikus alkalmazás, hihetetlenül hasznos, mivel nagy webhelyekkel dolgozik. Feltétlenül ellenőriznie kell, hogy az űrlapok hol vannak beágyazva az egész webhelyre.

Letöltés Screaming Frog SEO Spider

Mit gondolsz?

Ez az oldal Akismet-et használ a levélszemét csökkentése érdekében. Ismerje meg, hogyan dolgozik a megjegyzésed.