source: tools/scripts/telemeta-crem-import.py @ e878904

cremcrem2devdev2diademsfeature/breadcrumbsfeature/ts-0.5feature/ts-0.5.4feature/writecacheformagenericinstru_searchlamlam2mapsv3mergenlivemultiproductionrelease/1.4.4sabiodsecurityserversocialstoragetelecastertestvideo
Last change on this file since e878904 was e878904, checked in by yomguy <yomguy@…>, 2 years ago

crem import: bugfix

  • Property mode set to 100755
File size: 8.0 KB
Line 
1#!/usr/bin/python
2# -*- coding: utf-8 -*-
3#
4# Copyright (C) 2010 Guillaume Pellerin
5# All rights reserved.
6#
7# This software is licensed as described in the file COPYING, which
8# you should have received as part of this distribution. The terms
9# are also available at http://svn.parisson.org/telemeta/TelemetaLicense.
10#
11# Author: Guillaume Pellerin <yomguy@parisson.com>
12#
13
14import os
15import sys
16import csv
17import logging
18import datetime
19from django.core.management import setup_environ
20from django.core.files.base import ContentFile
21
22
23class Logger:
24
25    def __init__(self, file):
26        self.logger = logging.getLogger('myapp')
27        self.hdlr = logging.FileHandler(file)
28        self.formatter = logging.Formatter('%(asctime)s %(levelname)s %(message)s')
29        self.hdlr.setFormatter(self.formatter)
30        self.logger.addHandler(self.hdlr)
31        self.logger.setLevel(logging.INFO)
32
33    def info(self, prefix, message):
34        self.logger.info(' ' + prefix + ' : ' + message.decode('utf8'))
35
36    def error(self, prefix, message):
37        self.logger.error(prefix + ' : ' + message.decode('utf8'))
38
39
40class TelemetaWavImport:
41
42    def __init__(self, source_dir, log_file, pattern):
43        from django.contrib.auth.models import User
44        self.logger = Logger(log_file)
45        self.source_dir = source_dir
46        self.collections = os.listdir(self.source_dir)
47        self.pattern = pattern
48        self.user = User.objects.filter(username='admin')[0]
49
50    def write_file(self, item, wav_file, overwrite=False):
51        filename = wav_file.split(os.sep)[-1]
52        if os.path.exists(wav_file):
53            if not item.file or overwrite:
54                f = open(wav_file, 'r')
55                file_content = ContentFile(f.read())
56                item.file.save(filename, file_content)
57                f.close()
58                item.set_revision(self.user)
59            else:
60                msg = item.code + ' : fichier ' + item.file.name + ' deja inscrit dans la base de donnees !'
61                self.logger.error('item', msg)
62        else:
63            msg = item.code + ' : fichier audio ' + filename + ' inexistant dans le dossier !'
64            self.logger.error('item', msg)
65           
66    def wav_import(self):
67        from telemeta.models import MediaItem,  MediaCollection
68       
69        for collection in self.collections:
70            collection_dir = self.source_dir + os.sep + collection
71            collection_files = os.listdir(collection_dir)
72            collections = []
73           
74            if not '/.' in collection_dir and self.pattern in collection_dir:
75                collection_name = collection.split(os.sep)[-1]
76                collections.append(collection_name)
77                c = MediaCollection.objects.filter(code=collection_name)
78               
79                if not c and collection + '.csv' in collection_files:
80                    msg = collection + ' collection NON présente dans la base de données, SORTIE '
81                    self.logger.error(collection, msg)
82                    sys.exit(msg)
83                elif not c:
84                    msg = 'collection NON présente dans la base de données, CREATION '
85                    self.logger.info(collection, msg)
86                    c = MediaCollection(code=collection_name)
87                    c.save()
88                    c.set_revision(self.user)
89                else:
90                    msg = 'collection présente dans la base de données, SELECTION'
91                    self.logger.info(collection, msg)
92                   
93        for collection in collections:
94            collection_dir = self.source_dir + os.sep + collection
95            collection_name = collection
96            collection_files = os.listdir(collection_dir)
97            msg = '************************ ' + collection + ' ******************************'
98            self.logger.info(collection, msg[:70])
99            overwrite = True
100            csv_file = ''
101            rows = {}
102           
103            if collection + '.csv' in collection_files:
104                csv_file = self.source_dir + os.sep + collection + os.sep + collection + '.csv'
105                csv_data = csv.reader(open(csv_file), delimiter=';')
106                for row in csv_data:
107                    rows[row[1]] = row[0]
108                msg = collection + ' import du fichier CSV de la collection'
109                self.logger.info(collection, msg[:70])
110            else:
111                msg = collection + ' pas de fichier CSV dans la collection'
112                self.logger.info(collection, msg[:70])
113           
114            c = MediaCollection.objects.filter(code=collection_name)
115            if not c:
116                c = MediaCollection(code=collection_name)
117                c.save()
118                msg = ' collection NON présente dans la BDD, CREATION '
119                self.logger.info(c.code, msg)
120            else:
121                c = c[0]
122                msg = ' id = '+str(c.id)
123                self.logger.info(c.code, msg)
124           
125            audio_files = []
126            for file in collection_files:
127                ext = ['WAV', 'wav']
128                if file.split('.')[-1] in ext:
129                    audio_files.append(file)
130           
131            audio_files.sort()
132            nb_items = c.items.count()
133            counter = 0
134           
135            for file in audio_files:
136                code = file.split('.')[0]
137                wav_file = self.source_dir + os.sep + collection + os.sep + file
138               
139                if len(audio_files) <= nb_items:
140                    items = MediaItem.objects.filter(code=code)
141                   
142                    if code in rows and not items:
143                        old_ref = rows[code]
144                        items = MediaItem.objects.filter(old_code=old_ref)
145                       
146                    if items:
147                        item = items[0]
148                        msg = item.old_code + ' : Cas 1 ou 2 : id = ' + str(item.id)
149                        self.logger.info('item', msg)
150                        item.code = code
151                        item.save()
152                    else:
153                        item = MediaItem(code=code, collection=c)
154                        msg = item.code + ' : Cas 1 ou 2 : item NON présent dans la base de données, CREATION'
155                        self.logger.info('item', msg)
156                   
157                    self.write_file(item, wav_file, overwrite)
158                   
159                elif nb_items == 1 and len(audio_files) > 1:
160                    if counter == 0:
161                        msg = code + ' : Cas 3a : item n°01 présent dans la base de données, PASSE'
162                        self.logger.info('item', msg)
163                    else:
164                        item = MediaItem(code=code, collection=c)
165                        msg = item.code + ' : Cas 3a : item NON présent dans la base de données, CREATION'
166                        self.logger.info('item', msg)
167                        self.write_file(item, wav_file, overwrite)
168               
169                elif nb_items > 1 and nb_items < len(audio_files):
170                    msg = code + ' : Cas 3b : nb items < nb de fichiers audio, PAS de creation'
171                    self.logger.info('item', msg)
172
173                counter += 1
174
175def print_usage(tool_name):
176    print "Usage: "+tool_name+" <project_dir> <source_dir> <pattern> <log_file>"
177    print "  project_dir: the directory of the Django project which hosts Telemeta"
178    print "  source_dir: the directory containing the wav files to include"
179    print "  pattern: a pattern to match the collection names"
180    print "  log_file: a log file to write logs"
181
182def run():
183    if len(sys.argv) < 3:
184        print_usage(os.path.basename(sys.argv[0]))
185        sys.exit(1)
186    else:
187        project_dir = sys.argv[-4]
188        source_dir = sys.argv[-3]
189        pattern = sys.argv[-2]
190        log_file = sys.argv[-1]
191        sys.path.append(project_dir)
192        import settings
193        setup_environ(settings)
194        t = TelemetaWavImport(source_dir, log_file, pattern)
195        t.wav_import()
196
197if __name__ == '__main__':
198    run()
Note: See TracBrowser for help on using the repository browser.