25/11/2008 2 articles 5 min #22826

transductor

Ce nom à connotation neurologique signifie le passage du code html à travers un filtre mis en conformité, aux deux extêmités (entrée et sortie) aux caractéristiques de ce qui est attendu.

En entrée nous avons une somme incommensurable de possibilités de code HTML, dont la pire possible est celle issue du logiciel Word.

Ce code est imbriqué, mais ne doit pas contenir d'erreur, quoi qu'il arrive qu'elles soient absorbées.

Ce panneau est très utile pour préparer l'insertion des articles provenant d'autres sources, ou même pour créer un code html avec des outils simples (en le prenant dans la source).

C'est aussi ici qu'arrivent les requêtes en provenance du bouton "save" affiché lors du défilement des flux RSS.

Le Transductor se présente en trois partie :
- A gauche le code source, en HTML
- A droite le code de sortie en 01L non imbriqué.
- En dessous le rendu avant édition.

Par exemple le transducteur élimine les balises object et ne garde que les embed, dans une vidéo flash (comme youtube), puisque c'est tout ce dont nous avons réellement besoin.

Si un lien est entre des balises bold ou si le bold est à l'intérieur du lien, c'est un lien qui est retourné car il est prioritaire, sinon le texte revient en bold.

Détail de toutes les options

Options d'avant la conversion

url source

entrer ici une adresse URL et envoyer 'interpret'.
Les définitions doivent être déjà enregistrées, sinon se reporter aux Defcons, et ensuite rafraîchir cette page.

Le code source et les Defcons s'affichent dans les 4 petits champs de texte, pour respectivement les points et de sortie, du titre et du texte.

champ code source

Le code html peut être collé ici.

specify image source

Le système a besoin de connaître la racine du site pour situer les images, car souvent il ne figure pas dans le code source.

not_convert

Ne converti pas en 01L, mais supprime les balises html.

forget_tab

Oublie les définitions Defcons.

recursive

Effectue une transduction récursive, ce qui améliore quelquefois les résultats.

stop_dev

Ne faits pas attention, c'est pour le développeur.

text start: end

Point d'entrée du texte en html.

title start: end

Point de sortie du texte en html.

edit_defs

Edition des Defcons.
Il faut passer par là pour activer le dont le 'plug_motor' a besoin pour lancer ce plug-in.
C'est ici que seront paramétrés les définitions d'aspiration des pages.
Entre le moment où cela a ét inventé et aujourd'hui, on a inventé un terme pour désigner cette technologie : "le webservice".

forget defs

Ne tient pas compte des Defcons.

save_defs

Enregistre les définitions proposées.

no_br

le prend pas en compte les sauts de ligne du type BR (car il y en a d'autres...)

add p

Ajoute une balise p au début car parfois, en prenant le code source de la page sous firefox, la première balise est oubliée ce qui rend le code frauduleux.

no_br on p

Ne convertit pas les ouvertures de balises de paragraphe (P) en saut de ligne (puisque les paragraphes constituent en eux-mêmes des sauts de lignes).

no_br on /p

Ne convertit pas les fermtures de balise de paragraphe (/P) en saut de ligne.

br on span

Convertit les balises SPAN en saut de ligne ; ne sert à rien.

utf8_decode

Traduit la source depuis UTF-8.

show_embeds

Montre le déroulement de l'opération de transduction : permet de voir i les balises d'ouverture et de fermetures ont bien été trouvées.

Options post-opératoires

clean_mail

Nettoie les sauts de lignes imposés par les serveurs lors d'un conduit du texte par mail.

not clean_br

Evite de réduire le nombre de sauts de lignes.

. => n

Convertit les . en '.BR' ; très utile pour les texte compactés sans sauts de lignes.

clean_n

Efface tous les sauts de ligne de type /n.

trim

Efface les premiers et derniers caractères si ils sont invisibles (espaces, espaces spéciaux).

clean_punctuation

Applique les règles typographiques.

repair_tables

Nettoie les sauts de lignes /n à l'intérieur des tableaux.
Aussi, nettoie certaines irrégularités dues la plupart du temps à un code source fait manuellement.

del_tables

Efface la structure des tableaux.

erase_syntax

Efface la structure de mise en forme 01L

Replace

Permet d'effectuer des remplacements de texte (marche mieux que Word).

Envoi d'un résultat au système

Une fois le texte et le titre au point, ils figurent dans les champs inutiles pour l'utilisateur, et s'affichent en-dessous des formulaies.
C'est normal si les images renoient "img_not_loaded", tant qu'elles ne sont pas aspirées.

Si il est possible de préciser la date de parution, c'est pour prévoir si elle a lieu dans le futur.

Un menu déroulant ermet de choisir la rubrique de parution.

De là, le résultat peut être envoyé directement vers l'insertion d'un nouvel article.

 commentaire

articles affiliés ordre chronologique
25/11/2008 #22827

Defcons

Les Defcons, du nom du niveau d'alerte d'une armée en guerre (...), sont les définitions d'aspiration des articles.

Il s'agit d'ausculter le code source-type d'où part l'aspiration, et de le nommer au moyen de la partie unique de son URL.

Defcons est monté sur Plug_motor, lui même issu de G4z0lyne, qui est conjoint à 01L...