update_doc.py - Au quotidien - Redmine Entr’ouvert

Autre #851 » update_doc.py

Frédéric Péters, 12 novembre 2011 00:34

    
      #! /usr/bin/env python

      import sys

      import urllib2

      from optparse import OptionParser

      import re

      import random

      import os

      docs = {

          'wcs-fr': ('fr',

              'https://wiki.entrouvert.org/wcs/Guide_de_l%27utilisateur',

              'user-guide.html',

              'labs.libre-entreprise.org:/home/groups/wcs/htdocs/doc/fr/'),

          'wcs-admin-fr': ('fr',

              'https://wiki.entrouvert.org/wcs/Guide_de_l%27administrateur',

              'admin-guide.html',

              'labs.libre-entreprise.org:/home/groups/wcs/htdocs/doc/fr/'),

          'authentic-fr': ('fr',

              'https://wiki.entrouvert.org/Authentic/Guide_de_l%27administrateur',

              'authentic-admin.html',

              'labs.libre-entreprise.org:/home/groups/authentic/htdocs/doc/fr/'),

          'authentic-en': ('en',

              'https://wiki.entrouvert.org/Authentic/Administrator_Guide',

              'authentic-admin.html',

              'labs.libre-entreprise.org:/home/groups/authentic/htdocs/doc/en/'),

      }

      usage = 'usage: %prog [options] doc-id'

      parser = OptionParser(usage)

      parser.add_option('-u', '--user', dest = 'scpuser',

              help = 'user name on labs, for file upload via scp')

      parser.add_option('--css', dest = 'css', default = 'default.css',

              help = 'css file to use')

      (options, args) = parser.parse_args()

      if len(args) != 1:

          parser.error('incorrect number of arguments')

      doc_id = args[0]

      css = options.css

      if not docs.has_key(doc_id):

          parser.error('invalid doc id')

      tmpdir = '/tmp/.ud.%s' % random.random()

      os.mkdir(tmpdir)

      lang, url, filename, dest = docs[doc_id]

      raw = urllib2.urlopen(url + '?action=raw').read()

      t = re.findall('#pragma title (.*)', raw)

      if t:

          title = t[0]

          title = title.replace('---', '&mdash;')

      else:

          title = url.rsplit('/')[-1].replace('_', ' ')

      body = urllib2.urlopen(url + '?action=format&mimetype=text/html').read()

      figures = []

      def sub_img(matchobj):

          img = matchobj.group(0)

          src = re.findall('src="(.*?)"', img)[0]

          filename = src.split('=')[-1]

          figures.append((src, filename))

          return '<img src="figures/%s" />' % filename

      attachments = []

      def sub_attach(matchobj):

          target = matchobj.group(2)

          src = (matchobj.group(1) + matchobj.group(2)).replace('&amp;', '&')

          attachments.append((src, target))

          return 'href="attachments/%s"' % target

      file('/tmp/aze.html', 'w').write(body)

      if doc_id == 'wcs-fr':

          body = body.replace('/wcs/Guide_de_l%27administrateur', 'admin-guide.html')

          body = body.replace('../Guide', 'Guide')

      if doc_id == 'wcs-admin-fr':

          body = body.replace("http://wiki.entrouvert.org/wcs/Guide_de_l'utilisateur", 

                  'user-guide.html')

      body = re.sub('<img.*?>', sub_img, body)

      body = re.sub(r'class="attachment" href="(.*?AttachFile.*?target=)(.*?\.wcs)"', sub_attach, body)

      body = re.sub('<hr />.*Cat.*</a>', '', body)

      out = file(os.path.join(tmpdir, filename), 'w')

      print >> out, '''<?xml version="1.0" encoding="utf-8" ?>

      <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

      <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="%(lang)s" lang="%(lang)s">

      <head>

      <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

      <link rel="stylesheet" type="text/css" href="%(css)s" />

      <title>%(title)s</title>

      </head>

      <body>

      <div id="title">

      <h1>%(title)s</h1>

      </div>

      %(body)s

      </body>

      </html>

      ''' % locals()

      out.close()

      if figures:

          figdir = os.path.join(tmpdir, 'figures')

          os.mkdir(figdir)

          for (src, idest) in figures:

              url = 'http://wiki.entrouvert.org' + src

              try:

                  open(os.path.join(figdir, idest), 'w').write(urllib2.urlopen(url).read())

              except urllib2.HTTPError:

                  os.unlink(os.path.join(figdir, idest))

                  print >> sys.stderr, 'failed to download', idest

      if attachments:

          attdir = os.path.join(tmpdir, 'attachments')

          os.mkdir(attdir)

          for (src, idest) in attachments:

              if src.startswith('http://wiki.entrouvert.org'):

                  url = url

              elif src.startswith('http://'):

                  continue

              else:

                  url = 'http://wiki.entrouvert.org' + src

              print 'url:', url

              try:

                  open(os.path.join(attdir, idest), 'w').write(urllib2.urlopen(url).read())

              except urllib2.HTTPError:

                  raise

                  os.unlink(os.path.join(attdir, idest))

                  print >> sys.stderr, 'failed to download', idest

      if options.scpuser:

          user = '%s@' % options.scpuser

      else:

          user = ''

      scp_command = 'rsync -ravz %s/* %s%s' % (tmpdir, user, dest)

      os.system(scp_command)

Projet

Général

Profil

Produits Entr'ouvert » w.c.s. » Au quotidien

Autre #851 » update_doc.py