Vision du web. La réponse collaborative.

Gagner des Bitcoins.

Gagner des Bitcoins !
Le HackerSpace Vision du web.
La réponse collaborative.
Le glider des Hackers.
Un symbole de rassemblement.
QWERTY.
Du clavier au terminal.
GNU / Linux Debian.
La distribution universelle.
GNU / Linux Ubuntu.
Linux pour les êtres humains.
GNU / Linux Arch.
Un Linux léger et flexible.
Nom de code Linux.
Documentaire FR.

Le montant des donations pour Vision du web est de 0.058587088301867 Monero.

Soutenir Vision du Web dans son partage de logiciels et de ressources libres

Ce mineur crée de la monnaie numérique Monero pour soutenir Vision du web.
Merci de désactiver votre bloqueur de publicité.
Aucune publicité ne sera affichée.
Le mineur utilise les ressources de votre machine pour créer gratuitement de la monnaie numérique.

Vous n´êtes pas identifié(e).

Nous sommes le jeudi 19 juillet 2018. Il est .

Nous avons 188 invités et aucun membre en ligne

 
HackerSpace !
× Bash - Shell Linux.

Tester les liens de votre domaine avec Webcheck

  • Zer00CooL
  • Portrait de Zer00CooL Auteur du sujet
  • Hors Ligne
  • Modérateur
  • Modérateur
  • Le zéro, ce "rien qui peut tout".
Plus d'informations
il y a 1 an 1 mois - il y a 2 mois 4 semaines #2255 par Zer00CooL
Zer00CooL a créé le sujet : Tester les liens de votre domaine avec Webcheck
Tester les liens de votre domaine avec Webcheck

Pratique pour analyser les liens brisés d'une page web.
Télécharger le script (2010) : arthurdejong.org/webcheck/downloads.html - Contacter le développeur : <Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.>.
Télécharger le script (2015) : fr.archive.ubuntu.com/ubuntu/pool/universe/w/webcheck/

Installer webcheck
Décompresser le script qui vient d'être téléchargé.

Placer le dossier dans le path conseillé : /usr/local/lib/python/site-packages
Je met le paquet webcheck-1.10.4 dans /usr/lib/python2.7/ ( Je me suis trompé de path. ) : /usr/lib/python2.7/webcheck-1.10.4/

Je lance un test d'utilisation du script sans avoir installé webcheck-1.10.4

MintTesting webcheck-1.10.4 # webcheck -o /tmp/myreport www.visionduweb.eu
Le programme « webcheck » n'est pas encore installé. Vous pouvez l'installer en tapant : apt install webcheck

Le paquet webcheck est déjà pris en compte dans les dépôts de GNU/Linux Mint. Je lance l'installation depuis les dépôts officiels.

MintTesting webcheck-1.10.4 # apt install webcheck
Lecture des listes de paquets... Fait
Construction de l'arbre des dépendances
Lecture des informations d'état... Fait
Les NOUVEAUX paquets suivants seront installés :
webcheck
0 mis à jour, 1 nouvellement installés, 0 à enlever et 0 non mis à jour.
Il est nécessaire de prendre 54,6 ko dans les archives.
Après cette opération, 274 ko d'espace disque supplémentaires seront utilisés.
Réception de:1 fr.archive.ubuntu.com/ubuntu xenial/universe amd64 webcheck all 1.10.4-1 [54,6 kB]
54,6 ko réceptionnés en 1s (37,4 ko/s)
Sélection du paquet webcheck précédemment désélectionné.
(Lecture de la base de données... 381107 fichiers et répertoires déjà installés.)
Préparation du dépaquetage de .../webcheck_1.10.4-1_all.deb ...
Dépaquetage de webcheck (1.10.4-1) ...
Traitement des actions différées (« triggers ») pour man-db (2.7.5-1) ...
Paramétrage de webcheck (1.10.4-1) ...

L'installation est finie, lancer webcheck
Le script va lister l'ensemble des liens du domaine.

MintTesting webcheck-1.10.4 # webcheck -o /tmp/myreport www.visionduweb.eu
webcheck: checking site....
webcheck: getting robots.txt for www.visionduweb.eu
webcheck: www.visionduweb.eu/
webcheck: www.visionduweb.eu/forum/acces-tout-public/1692-un-endroit-v...lme-et-isole-du-reste-du-monde
webcheck: www.visionduweb.eu/forum/credits
webcheck: www.tiger-green.fr/
webcheck: www.visionduweb.eu/forum/france
webcheck: www.visionduweb.eu/annuaire/musiques
webcheck: www.visionduweb.eu/contact
webcheck: www.visionduweb.eu/annuaire/musiques/category/varietes-internationales
webcheck: www.visionduweb.eu/forum/hack-et-pentest/1684-athena-le-malw...a-d-espionner-tous-les-windows
webcheck: www.visionduweb.eu/forum/france/1593-interdiction-de-la-circ...ris-au-profit-de-la-bicyclette
webcheck: www.visionduweb.eu/annuaire
webcheck: www.visionduweb.eu/forum/taverne

Utiliser le manuel pour plus d'informations sur la commande
man webcheck

NAME
webcheck - website link checker

SYNOPSIS
webcheck [OPTION]... URL

DESCRIPTION
webcheck will check the document at the specified URL for links to
other documents, follow these links recursively and generate an HTML
report.

-i, --internal=PATTERN
Mark URLs matching the PATTERN (perl-type regular expression) as
an internal link. Can be used multiple times. Note that the
PATTERN is matched against the full URL. URLs matching this
PATTERN will be considered internal, even if they match one of
the --external PATTERNs.

-x, --external=PATTERN
Mark URLs matching the PATTERN (perl-type regular expression) as
an external link. Can be used multiple times. Note that the
PATTERN is matched against the full URL.

-y, --yank=PATTERN
Do not check URLs matching the PATTERN (perl-type regular
expression). Like the -x flag, though this option will cause
webcheck to not check the link matched by regex whereas -x will
check the link but not its children. Can be used multiple
times. Note that the PATTERN is matched against the full URL.

-b, --base-only
Consider any URL not starting with the base URL to be external.
For example, if you run
webcheck -b http://www.example.com/foo
then
http://www.example.com/foo/bar
will be considered internal
whereas
http://www.example.com
will be considered external. By
default all the pages on the site will be considered internal.

-a, --avoid-external
Avoid external links. Normally if webcheck is examining an HTML
page and it finds a link that points to an external document, it
will check to see if that external document exists. This flag
disables that action.

--ignore-robots
Do not retrieve and parse robots.txt files. By default
robots.txt files are retrieved and honored. If you are sure you
want to ignore and override the webmaster's decision this option
can be used.
For more information on robots.txt handling see the NOTES
section below.

-q, --quiet, --silent
Do not print out progress as webcheck traverses a site.

-d, --debug
Print debugging information while crawling the site. This
option is mainly useful for developers.

-o, --output=DIRECTORY
Output directory. Use to specify the directory where webcheck
will dump its reports. The default is the current directory or
as specified by config.py. If this directory does not exist it
will be created for you (if possible).

-c, --continue
Try to continue from a previous run. When using this option
webcheck will look for a webcheck.dat in the output directory.
This file is read to restore the state from the previous run.
This allows webcheck to continue a previously interrupted run.
When this option is used, the --internal, --external and --yank
options will be ignored as well as any URL arguments. The
--base-only and --avoid-external options should be the same as
the previous run.
Note that this option is experimental and it's semantics may
change with coming releases (especially in relation to other
options). Also note that the stored files are not guaranteed to
be compatible between releases.

-f, --force
Overwrite files without asking. This option is required for
running webcheck non-interactively.

-r, --redirects=N
Redirect depth. the number of redirects webcheck should follow
when following a link. 0 implies to follow all redirects.

-u, --userpass=URL
Specify a URL with username and password information to use for
basic authentication when visiting the site.
e.g.
http://test:Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
This option may be specified multiple times.

-w, --wait=SECONDS
Wait SECONDS between document retrievals. Usually webcheck will
process a url and immediately move on to the next. However on
some loaded systems it may be desirable to have webcheck pause
between requests. This option can be set to any non-negative
number.

-v, --version
Show version of program.

-h, --help
Show short summary of options.

URL CLASSES
URLs are divided into two classes:

Internal URLs are retrieved and the retrieved item is checked for
syntax. Also, the retrieved item is searched for links to other items
(of any class) and these links are followed.

External URLs are only retrieved to test whether they are valid and to
gather some basic information from them (title, size, content-type,
etc). The retrieved items are not inspected for links to other items.

Apart from their class, URLs can also be considered yanked (as
specified with the --yank or --avoid-external options). The URLs can
be either internal or external and will not be retrieved or checked at
all. URLs of unsupported schemes are also considered yanked.

EXAMPLES
Check the site www.example.com but consider any path with "/webcheck"
in it to be external.
webcheck http://www.example.com/ -x /webcheck

NOTES
When checking internal URLs webcheck honors the robots.txt file,
identifying itself as user-agent webcheck. Disallowed links will not be
checked at all as if the -y option was specified for that URL. To allow
webcheck to crawl parts of a site that other robots are disallowed, use
something like:
User-agent: *
Disallow: /foo

User-agent: webcheck
Allow: /foo

ENVIRONMENT
<scheme>_proxy
Proxy url for <scheme>.

REPORTING BUGS
Bug reports shoult be sent to the mailing list
<webcheck-
       Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.>
. More information on reporting bugs can
be found on the webcheck homepage:
arthurdejong.org/webcheck/

COPYRIGHT
Copyright © 1998, 1999 Albert Hopkins (marduk)
Copyright © 2002 Mike W. Meyer
Copyright © 2005, 2006, 2007, 2008, 2009, 2010 Arthur de Jong
webcheck is free software; see the source for copying conditions.
There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A
PARTICULAR PURPOSE.
The files produced as output from the software do not automatically
fall under the copyright of the software, unless explicitly stated otherwise.

Contre le camp de la majorité silencieuse, j'ai choisi la minorité bavarde.
L'urgent est fait, l'impossible est en cours, pour les miracles prévoir un délai.
Dernière édition: il y a 2 mois 4 semaines par Zer00CooL.

Connexion ou Créer un compte pour participer à la conversation.

REMARQUE ! Ce site utilise des cookies et autres technologies similaires.

Si vous ne changez pas les paramètres de votre navigateur, vous êtes d'accord. En savoir plus

J'ai compris

En poursuivant votre navigation sur ce site, vous acceptez l’utilisation de Cookies pour vous proposer un accès membre personnalisé et réaliser des statistiques de visites.

Vision du web sur votre réseau social

Vision du web :A Member of The Internet Defense League.