notebook.community

Edit and run



In [1]:

    
import xlrd
import string
from collections import defaultdict



In [2]:

    
workbook = xlrd.open_workbook('Andinomys_edax_inicial_limpeza_de_dados.xls')
dados = workbook.sheet_by_name('dados')



In [3]:

    
fvista_a = (1,2)
fvista_z = (1,10)
vistas = [fvista_a, fvista_z]



In [4]:

    
def cell_name_idx(s):
    b = 1
    n = 0
    for i in [string.lowercase.index(string.lower(c)) for c in reversed(s)]:
        n += b*(i+1)
        b *= (string.lowercase.index('z') + 1)
    
    return n-1



In [5]:

    
def get_points_names(data, vistas):
    d = defaultdict(list)
    for i, coords in enumerate(vistas):
        line = coords[0] + 1
        col = coords[1]
        p = data.cell(line, col)
        while p.value != '':
            d[data.cell(*vistas[i]).value].append((p.value, (line, col)))
            line += 1
            p = data.cell(line, col)
    
    return d



In [6]:

    
def read_all_points(data, vistas, num_mes=1):
    INFO_COL = 1
    
    points = []
    line = 0
    col = 0
    
    i = 0
    run = True
    
    points_info = get_points_names(data, vistas)
    points_lines_max = max(map(len, points_info.values()))

    parsed = 0
    
    while parsed < num_mes:
        points.append({})
        
        # Get Info
        points[-1]['info'] = []
        l = line + 1
        p = data.cell(l, INFO_COL).value

        while p != '':
            points[-1]['info'].append(p)
            l += 1
            p = data.cell(l, INFO_COL).value
                          
        for v in vistas:
            vname = data.cell(*v).value
            points[-1][vname] = {}
            
            for i, p in enumerate(points_info[vname]):
                points[-1][vname][p[0]] = {}
                
                # Get X
                points[-1][vname][p[0]]['x'] = []
                points[-1][vname][p[0]]['x'].append(data.cell(p[1][0] + line, p[1][1]+1).value)
                points[-1][vname][p[0]]['x'].append(data.cell(p[1][0] + line, p[1][1]+4).value)
                
                # Get Y
                points[-1][vname][p[0]]['y'] = []
                points[-1][vname][p[0]]['y'].append(data.cell(p[1][0] + line, p[1][1]+2).value)
                points[-1][vname][p[0]]['y'].append(data.cell(p[1][0] + line, p[1][1]+5).value)
                
                # Get Z
                points[-1][vname][p[0]]['z'] = []
                points[-1][vname][p[0]]['z'].append(data.cell(p[1][0] + line, p[1][1]+3).value)
                points[-1][vname][p[0]]['z'].append(data.cell(p[1][0] + line, p[1][1]+6).value)                

        line += points_lines_max + 3
        parsed += 1
        
    return points



In [7]:

    
def get_distance_names(data, columns):
    dists_names = defaultdict(list)
    for c in columns:
        line = c[0] + 1
        col = cell_name_idx(c[1])
        vista = data.cell(line - 2, col).value
        
        dist = data.cell(line, col).value
        while dist != '':
            dists_names[vista].append(dist)
            line += 1
            dist = data.cell(line, col).value
    
    for k in dists_names.keys():
        dists_names[k] = map(lambda d: d.split('-'), dists_names[k])
        dists_names[k] = [[p[0].rstrip(), p[1].rstrip()] for p in dists_names[k]]
        
    return dists_names



In [8]:

    
d = get_distance_names(dados, [(1,'S'), (1, 'W'), (1,'AB')])



In [9]:

    
def calc_distances(points, dist_names, i):
    ps = points[i]
    distances = {}
    
    for v in dist_names.keys():
        distances[v] = {}
        for dp in dist_names[v]:
            dist_key = '{}-{}'.format(dp[0], dp[1])
            
            if dp[1][-1] == 'e' or dp[1][-1] == 'd':
                pk = dp[0] + ' ' + dp[1][-1]
                if ps[v].has_key(pk):
                    if ps[v].has_key(dp[1]):
                        point1_key = pk
                        point2_key = dp[1]
                    else:
                        point1_key = pk
                        point2_key = dp[1][:-2]                     
                else:
                    point1_key = dp[0]
                    point2_key = dp[1]
            else:
                point1_key = dp[0]
                point2_key = dp[1]
                        
            dist1_x = ps[v][point1_key]['x'][0]- ps[v][point2_key]['x'][0]
            dist1_y = ps[v][point1_key]['y'][0]- ps[v][point2_key]['y'][0]
            dist1_z = ps[v][point1_key]['z'][0]- ps[v][point2_key]['z'][0]
                            
            dist2_x = ps[v][point1_key]['x'][1]- ps[v][point2_key]['x'][1]
            dist2_y = ps[v][point1_key]['y'][1]- ps[v][point2_key]['y'][1]
            dist2_z = ps[v][point1_key]['z'][1]- ps[v][point2_key]['z'][1]                        
                    
            distances[v][dist_key] = []
            distances[v][dist_key].append(np.sqrt(dist1_x**2 + dist1_y**2 + dist1_z**2))
            distances[v][dist_key].append(np.sqrt(dist2_x**2 + dist2_y**2 + dist2_z**2))
        
    return distances



In [10]:

    
def avg_distances(distances):
    avg_distances = {}
    for vista in distances.keys():
        avg_distances[vista] = {}
        for d in distances[vista].keys():
            if d[-1] == 'e':
                if distances[vista].has_key(d[:-1] + 'd'):
                    avg_distances[vista][d[:-1]] = np.average([np.average(distances[vista][d]), np.average(distances[vista][d[:-1] + 'd'])])
                else:
                    avg_distances[vista][d] = np.average(distances[vista][d])
            elif d[-1] == 'd':
                if distances[vista].has_key(d[:-1] + 'e'):
                    avg_distances[vista][d[:-1]] = np.average([np.average(distances[vista][d]), np.average(distances[vista][d[:-1] + 'e'])])
                else:
                    avg_distances[vista][d] = np.average(distances[vista][d])
            else:
                avg_distances[vista][d] = np.average(distances[vista][d])
            
    return avg_distances



In [12]:

    
p = read_all_points(dados, vistas, num_mes=10)
d = get_distance_names(dados, [(1,'S'), (1, 'W'), (1,'AB')])
dists = calc_distances(p, d, 0)
avg_distances(dists)









    Out[12]:





{u'Vista A': {'APET-BA ': 5.4284049445915006,
  'APET-TS ': 4.8272707767180032,
  'BA-EAM ': 7.9837027979446384,
  'BA-OPI': 4.9840628451544742,
  'BR-APET ': 10.399687577422169,
  'BR-PT ': 4.9376157651606913,
  'EAM-PEAM ': 2.5077533540563453,
  'EAM-ZYGO ': 6.697139681134642,
  'EZ-M1 ': 7.5050936972367364,
  'FIA-FIP': 8.0500203877768044,
  'IS-NSL': 7.9835483267883411,
  'IS-PM ': 7.2165104748121927,
  'IS-PNS': 18.162536702282466,
  'LRI e-LRI d': 3.7982829731568488,
  'MT-M1 ': 8.4708633315627111,
  'MT-PNS ': 3.2988090694128247,
  'NA-BR': 11.916880736423607,
  'NA-PNS': 11.445259104021353,
  'NFI-FIV ': 5.0275882394132712,
  'NSL-NA': 14.417663407200946,
  'NSL-ZI ': 23.542236324941499,
  'NSL-ZS ': 20.186517607638919,
  'PL-FO ': 8.3879372080603414,
  'PM e-PM d': 3.2106744310327713,
  'PM-MT ': 13.198905111805818,
  'PM-ZI ': 14.976195189127212,
  'PM-ZS ': 12.314545933095534,
  'PNS-APET ': 7.3242120045197012,
  'PT-APET ': 11.599022685215647,
  'PT-BA ': 15.69724284688202,
  'PT-EAM ': 12.300362109770152,
  'PT-TSP ': 5.5039851371147552,
  'PT-ZYGO ': 9.7516620682839488,
  'TS d-JP d': 5.959040982858065,
  'TS e-JP e': 5.6467189679844854,
  'ZI-MT ': 6.5792456612714441,
  'ZI-TSP ': 5.5879014547498613,
  'ZI-ZYGO ': 2.6920130965774405,
  'ZS-ZI ': 3.8446942841561,
  'ZYGO-TSP ': 5.7685673400677562},
 u'Vista Z': {'BA-OPI': 5.3395152991316319,
  'BR-LD': 9.3488854421896512,
  'IT e-IT d': 10.386086579423189,
  'JP-AS ': 6.0724193361503112,
  'LD-AS ': 6.617655969517946,
  'LD2-BR': 5.2838322306067802,
  'OPI-LD': 4.4390322960297128,
  'PT-AS ': 11.703740740922804,
  'TS d-JP d': 5.6956084299171685,
  'TS e-JP e': 6.2112155936413753}}



In [11]: