notebook.community

Edit and run



In [1]:

    
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import subprocess
%matplotlib inline



In [2]:

    
GlpG_seq = "ERAGPVTWVMMIACVVVFIAMQILGDQEVMLWLAWPFDPTLKFEFWRYFTHALMHFSLMHILFNLLWWWYLGGAVEKRLGSGKLIVITLISALLSGYVQQKFSGPWFGGLSGVVYALMGYVWLRGERDPQSGIYLQRGLIIFALIWIVAGWFDLFGMSMANGAHIAGLAVGLAMAFVDSLN"



In [1]:

    
t = "MTRTEIIRELERSLRLQLVLAIFLMALLIVLLWLQQNGSSNNNVNYLLIVILVLVLVIVALAVIQKYLVEQLKRQADPTDDSRTEIIRELERSLRLQLVLAIFLMALLIVLLWLQQNGSSNNNVNYLLIVILVLVLVIVALAVTQKYLVEQLKRQD"



In [2]:

    
scTMHC2_seq = "MTRTEIIRELERSLRLQLVLAIFLMALLIVLLWLQQNGSSNNNVNYLLIVILVLVLVIVALAVIQKYLVEQLKRQADPTDDSRTEIIRELERSLRLQLVLAIFLMALLIVLLWLQQNGSSNNNVNYLLIVILVLVLVIVALAVTQKYLVEQLKRQD"



In [2]:

    
def getFromTerminal(CMD):
    return subprocess.Popen(CMD,stdout=subprocess.PIPE,shell=True).communicate()[0].decode()



In [3]:

    
len(scTMHC2_seq)









    



---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<ipython-input-3-186cecb8f562> in <module>()
----> 1 len(scTMHC2_seq)

NameError: name 'scTMHC2_seq' is not defined



In [ ]:



In [29]:

    
seq = scTMHC2_seq



In [4]:

    
seq = GlpG_seq
len(seq)









    Out[4]:





181



In [5]:

    
seq_dataFrame = pd.DataFrame({"oneLetterCode":list(seq)})
HFscales = pd.read_table("/Users/weilu/opt/small_script/Whole_residue_HFscales.txt")
# Octanol Scale
# code = {"GLY" : "G", "ALA" : "A", "LEU" : "L", "ILE" : "I",
#         "ARG+" : "R", "LYS+" : "K", "MET" : "M", "CYS" : "C",
#         "TYR" : "Y", "THR" : "T", "PRO" : "P", "SER" : "S",
#         "TRP" : "W", "ASP-" : "D", "GLU-" : "E", "ASN" : "N",
#         "GLN" : "Q", "PHE" : "F", "HIS+" : "H", "VAL" : "V",
#         "M3L" : "K", "MSE" : "M", "CAS" : "C" }
code = {"GLY" : "G", "ALA" : "A", "LEU" : "L", "ILE" : "I",
        "ARG+" : "R", "LYS+" : "K", "MET" : "M", "CYS" : "C",
        "TYR" : "Y", "THR" : "T", "PRO" : "P", "SER" : "S",
        "TRP" : "W", "ASP-" : "D", "GLU-" : "E", "ASN" : "N",
        "GLN" : "Q", "PHE" : "F", "HIS0" : "H", "VAL" : "V",
        "M3L" : "K", "MSE" : "M", "CAS" : "C" }
HFscales_with_oneLetterCode = HFscales.assign(oneLetterCode = HFscales.AA.str.upper().map(code)).dropna()
data = seq_dataFrame.merge(HFscales_with_oneLetterCode, on="oneLetterCode", how="left")



In [19]:

    
print(HFscales.query("AA !='His+' and AA != 'Glu0'")[["AA", "DGwoct"]].to_latex())









    



\begin{tabular}{llr}
\toprule
{} &    AA &  DGwoct \\
\midrule
0  &   Ala &    0.50 \\
1  &  Arg+ &    1.81 \\
2  &   Asn &    0.85 \\
3  &  Asp- &    3.64 \\
4  &  Asp0 &    0.43 \\
5  &   Cys &   -0.02 \\
6  &   Gln &    0.77 \\
7  &  Glu- &    3.63 \\
9  &   Gly &    1.15 \\
11 &  His0 &    0.11 \\
12 &   Ile &   -1.12 \\
13 &   Leu &   -1.25 \\
14 &  Lys+ &    2.80 \\
15 &   Met &   -0.67 \\
16 &   Phe &   -1.71 \\
17 &   Pro &    0.14 \\
18 &   Ser &    0.46 \\
19 &   Thr &    0.25 \\
20 &   Trp &   -2.09 \\
21 &   Tyr &   -0.71 \\
22 &   Val &   -0.46 \\
\bottomrule
\end{tabular}



In [8]:

    
HFscales.to_latex()









    Out[8]:





'\\begin{tabular}{llrrr}\n\\toprule\n{} &    AA &  DGwif &  DGwoct &  Oct-IF \\\\\n\\midrule\n0  &   Ala &   0.17 &    0.50 &    0.33 \\\\\n1  &  Arg+ &   0.81 &    1.81 &    1.00 \\\\\n2  &   Asn &   0.42 &    0.85 &    0.43 \\\\\n3  &  Asp- &   1.23 &    3.64 &    2.41 \\\\\n4  &  Asp0 &  -0.07 &    0.43 &    0.50 \\\\\n5  &   Cys &  -0.24 &   -0.02 &    0.22 \\\\\n6  &   Gln &   0.58 &    0.77 &    0.19 \\\\\n7  &  Glu- &   2.02 &    3.63 &    1.61 \\\\\n8  &  Glu0 &  -0.01 &    0.11 &    0.12 \\\\\n9  &   Gly &   0.01 &    1.15 &    1.14 \\\\\n10 &  His+ &   0.96 &    2.33 &    1.37 \\\\\n11 &  His0 &   0.17 &    0.11 &   -0.06 \\\\\n12 &   Ile &  -0.31 &   -1.12 &   -0.81 \\\\\n13 &   Leu &  -0.56 &   -1.25 &   -0.69 \\\\\n14 &  Lys+ &   0.99 &    2.80 &    1.81 \\\\\n15 &   Met &  -0.23 &   -0.67 &   -0.44 \\\\\n16 &   Phe &  -1.13 &   -1.71 &   -0.58 \\\\\n17 &   Pro &   0.45 &    0.14 &   -0.31 \\\\\n18 &   Ser &   0.13 &    0.46 &    0.33 \\\\\n19 &   Thr &   0.14 &    0.25 &    0.11 \\\\\n20 &   Trp &  -1.85 &   -2.09 &   -0.24 \\\\\n21 &   Tyr &  -0.94 &   -0.71 &    0.23 \\\\\n22 &   Val &   0.07 &   -0.46 &   -0.53 \\\\\n\\bottomrule\n\\end{tabular}\n'



In [6]:

    
data.plot("oneLetterCode", "DGwoct", kind="bar")
plt.show()



In [10]:

    
data









    Out[10]:







  
    
      
      oneLetterCode
      AA
      DGwif
      DGwoct
      Oct-IF
    
  
  
    
      0
      E
      Glu-
      2.02
      3.63
      1.61
    
    
      1
      R
      Arg+
      0.81
      1.81
      1.00
    
    
      2
      A
      Ala
      0.17
      0.50
      0.33
    
    
      3
      G
      Gly
      0.01
      1.15
      1.14
    
    
      4
      P
      Pro
      0.45
      0.14
      -0.31
    
    
      5
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      6
      T
      Thr
      0.14
      0.25
      0.11
    
    
      7
      W
      Trp
      -1.85
      -2.09
      -0.24
    
    
      8
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      9
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      10
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      11
      I
      Ile
      -0.31
      -1.12
      -0.81
    
    
      12
      A
      Ala
      0.17
      0.50
      0.33
    
    
      13
      C
      Cys
      -0.24
      -0.02
      0.22
    
    
      14
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      15
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      16
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      17
      F
      Phe
      -1.13
      -1.71
      -0.58
    
    
      18
      I
      Ile
      -0.31
      -1.12
      -0.81
    
    
      19
      A
      Ala
      0.17
      0.50
      0.33
    
    
      20
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      21
      Q
      Gln
      0.58
      0.77
      0.19
    
    
      22
      I
      Ile
      -0.31
      -1.12
      -0.81
    
    
      23
      L
      Leu
      -0.56
      -1.25
      -0.69
    
    
      24
      G
      Gly
      0.01
      1.15
      1.14
    
    
      25
      D
      Asp-
      1.23
      3.64
      2.41
    
    
      26
      Q
      Gln
      0.58
      0.77
      0.19
    
    
      27
      E
      Glu-
      2.02
      3.63
      1.61
    
    
      28
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      29
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      151
      F
      Phe
      -1.13
      -1.71
      -0.58
    
    
      152
      D
      Asp-
      1.23
      3.64
      2.41
    
    
      153
      L
      Leu
      -0.56
      -1.25
      -0.69
    
    
      154
      F
      Phe
      -1.13
      -1.71
      -0.58
    
    
      155
      G
      Gly
      0.01
      1.15
      1.14
    
    
      156
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      157
      S
      Ser
      0.13
      0.46
      0.33
    
    
      158
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      159
      A
      Ala
      0.17
      0.50
      0.33
    
    
      160
      N
      Asn
      0.42
      0.85
      0.43
    
    
      161
      G
      Gly
      0.01
      1.15
      1.14
    
    
      162
      A
      Ala
      0.17
      0.50
      0.33
    
    
      163
      H
      His0
      0.17
      0.11
      -0.06
    
    
      164
      I
      Ile
      -0.31
      -1.12
      -0.81
    
    
      165
      A
      Ala
      0.17
      0.50
      0.33
    
    
      166
      G
      Gly
      0.01
      1.15
      1.14
    
    
      167
      L
      Leu
      -0.56
      -1.25
      -0.69
    
    
      168
      A
      Ala
      0.17
      0.50
      0.33
    
    
      169
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      170
      G
      Gly
      0.01
      1.15
      1.14
    
    
      171
      L
      Leu
      -0.56
      -1.25
      -0.69
    
    
      172
      A
      Ala
      0.17
      0.50
      0.33
    
    
      173
      M
      Met
      -0.23
      -0.67
      -0.44
    
    
      174
      A
      Ala
      0.17
      0.50
      0.33
    
    
      175
      F
      Phe
      -1.13
      -1.71
      -0.58
    
    
      176
      V
      Val
      0.07
      -0.46
      -0.53
    
    
      177
      D
      Asp-
      1.23
      3.64
      2.41
    
    
      178
      S
      Ser
      0.13
      0.46
      0.33
    
    
      179
      L
      Leu
      -0.56
      -1.25
      -0.69
    
    
      180
      N
      Asn
      0.42
      0.85
      0.43
    
  

181 rows × 5 columns



In [9]:

    
data[24:57].sum()









    Out[9]:





oneLetterCode                    GDQEVMLWLAWPFDPTLKFEFWRYFTHALMHFS
AA               GlyAsp-GlnGlu-ValMetLeuTrpLeuAlaTrpProPheAsp-P...
DGwif                                                        -3.89
DGwoct                                                         1.2
Oct-IF                                                        5.09
dtype: object



In [6]:

    
data.query("oneLetterCode == 'H'")









    Out[6]:







  
    
      
      oneLetterCode
      AA
      DGwif
      DGwoct
      Oct-IF
    
  
  
    
      50
      H
      His0
      0.17
      0.11
      -0.06
    
    
      54
      H
      His0
      0.17
      0.11
      -0.06
    
    
      59
      H
      His0
      0.17
      0.11
      -0.06
    
    
      163
      H
      His0
      0.17
      0.11
      -0.06



In [31]:

    
HFscales



In [6]:

    
x = HFscales_with_oneLetterCode["DGwif"].values
y = HFscales_with_oneLetterCode["DGwoct"].values



In [7]:

    
z = data["DGwoct"].values
np.savetxt("/Users/weilu/Research/server/apr_2018/rg_0.15_lipid_1.0_mem_1_go_0.8/simulation/dis_30.0/1/original_9/test", z, fmt="%.2f")



In [23]:

    
z = data["Oct-IF"].values
np.savetxt("/Users/weilu/Research/server/apr_2018/zim_oct_if", z, fmt="%.2f")



In [8]:

    
data.query("oneLetterCode == 'H'")









    Out[8]:







  
    
      
      oneLetterCode
      AA
      DGwif
      DGwoct
      Oct-IF
    
  
  
    
      50
      H
      His0
      0.17
      0.11
      -0.06
    
    
      54
      H
      His0
      0.17
      0.11
      -0.06
    
    
      59
      H
      His0
      0.17
      0.11
      -0.06
    
    
      163
      H
      His0
      0.17
      0.11
      -0.06



In [10]:

    
import scipy
from scipy import stats



In [11]:

    
slope, intercept, r_value, p_value, std_err = scipy.stats.linregress(x,y)



In [12]:

    
r_value









    Out[12]:





0.91940864394069144



In [13]:

    
intercept









    Out[13]:





0.23821446874895916



In [11]:

    
HFscales_with_oneLetterCode.plot("Oct-IF", "DGwoct", kind="scatter")









    Out[11]:





<matplotlib.axes._subplots.AxesSubplot at 0x1142926a0>



In [ ]:



In [14]:

    
HFscales_with_oneLetterCode.plot("DGwif", "DGwoct", kind="scatter")









    Out[14]:





<matplotlib.axes._subplots.AxesSubplot at 0x112bc7f28>



In [15]:

    
HFscales_with_oneLetterCode.plot("oneLetterCode", "DGwoct", kind="bar")









    Out[15]:





<matplotlib.axes._subplots.AxesSubplot at 0x1159a1080>



In [12]:

    
HFscales_with_oneLetterCode.plot("oneLetterCode", "Oct-IF", kind="bar")









    Out[12]:





<matplotlib.axes._subplots.AxesSubplot at 0x11c76b940>



In [22]:

    
def isHelix(id):
    helices_list = [(94,114), (147,168), (171, 192), (200, 217), (226, 241), (250, 269)]
    for count, (i, j) in enumerate(helices_list):
        if id >= i and id <= j:
            return 1+count
    return 0
data["resId"] = 91 + data.index
data["isHelix"] = data["resId"].apply(isHelix)



In [23]:

    
def isHelix2(id):
    helices_list = [(95,114), (148,169), (171, 193), (201, 217), (227, 241), (251, 268)]
    for count, (i, j) in enumerate(helices_list):
        if id >= i and id <= j:
            return 1+count
    return 0
data["resId"] = 91 + data.index
data["isHelix2"] = data["resId"].apply(isHelix2)



In [24]:

    
def isHelix3(id):
    helices_list = [(91,114), (115,169), (171, 192), (193, 217), (226, 241), (242, 268)]
    for count, (i, j) in enumerate(helices_list):
        if id >= i and id <= j:
            return 1+count
    return 0
data["resId"] = 91 + data.index
data["isHelix3"] = data["resId"].apply(isHelix3)



In [25]:

    
def isHelix4(id):
    helices_list = [(91,114), (115,170), (174, 192), (193, 213), (229, 241), (242, 267)]
    for count, (i, j) in enumerate(helices_list):
        if id >= i and id <= j:
            return 1+count
    return 0
data["resId"] = 91 + data.index
data["isHelix4"] = data["resId"].apply(isHelix4)



In [26]:

    
data.groupby("isHelix").sum()



In [9]:

    
data.groupby("isHelix4").sum()



In [12]:

    
data.groupby("isHelix4").sum().sum(axis=0)









    Out[12]:





DGwif        -22.81
DGwoct        -6.05
Oct-IF        16.76
resId      32761.00
isHelix      403.00
dtype: float64



In [33]:

    
a = data.groupby("isHelix3").sum().drop(["isHelix","isHelix2", "isHelix4"], axis=1)[1:].reset_index()
a["group"] = (a["isHelix3"]+1) // 2
b = a.groupby("group").sum()
b.drop(["resId", "isHelix3"],axis=1).plot()









    Out[33]:





<matplotlib.axes._subplots.AxesSubplot at 0x10bcd7be0>



In [32]:

    
a = data.groupby("isHelix2").sum().drop(["isHelix","isHelix3", "isHelix4"], axis=1)[1:].reset_index()
a["group"] = (a["isHelix2"]+1) // 2
b = a.groupby("group").sum()
b.drop(["resId", "isHelix2"],axis=1).plot()









    Out[32]:





<matplotlib.axes._subplots.AxesSubplot at 0x10bf35278>



In [31]:

    
a = data.groupby("isHelix4").sum()[1:].reset_index()
a["group"] = (a["isHelix4"]+1) // 2
b = a.groupby("group").sum()
b.drop(["resId", "isHelix4"],axis=1).plot()









    Out[31]:





<matplotlib.axes._subplots.AxesSubplot at 0x11abec4e0>



In [59]:

    
data[110:]









    Out[59]:







  
    
      
      oneLetterCode
      AA
      DGwif
      DGwoct
      Oct-IF
      resId
      isHelix
      isHelix2
      isHelix3
      isHelix4
      isHelix5
      isHelix6
    
  
  
    
      110
      S
      Ser
      0.13
      0.46
      0.33
      201
      4
      4
      4
      4
      4
      4
    
    
      111
      G
      Gly
      0.01
      1.15
      1.14
      202
      4
      4
      4
      4
      4
      4
    
    
      112
      V
      Val
      0.07
      -0.46
      -0.53
      203
      4
      4
      4
      4
      4
      4
    
    
      113
      V
      Val
      0.07
      -0.46
      -0.53
      204
      4
      4
      4
      4
      4
      4
    
    
      114
      Y
      Tyr
      -0.94
      -0.71
      0.23
      205
      4
      4
      4
      4
      4
      4
    
    
      115
      A
      Ala
      0.17
      0.50
      0.33
      206
      4
      4
      4
      4
      4
      4
    
    
      116
      L
      Leu
      -0.56
      -1.25
      -0.69
      207
      4
      4
      4
      4
      4
      4
    
    
      117
      M
      Met
      -0.23
      -0.67
      -0.44
      208
      4
      4
      4
      4
      4
      4
    
    
      118
      G
      Gly
      0.01
      1.15
      1.14
      209
      4
      4
      4
      4
      4
      4
    
    
      119
      Y
      Tyr
      -0.94
      -0.71
      0.23
      210
      4
      4
      4
      4
      4
      4
    
    
      120
      V
      Val
      0.07
      -0.46
      -0.53
      211
      4
      4
      4
      4
      4
      4
    
    
      121
      W
      Trp
      -1.85
      -2.09
      -0.24
      212
      4
      4
      4
      4
      4
      4
    
    
      122
      L
      Leu
      -0.56
      -1.25
      -0.69
      213
      4
      4
      4
      4
      4
      4
    
    
      123
      R
      Arg+
      0.81
      1.81
      1.00
      214
      4
      4
      4
      0
      0
      0
    
    
      124
      G
      Gly
      0.01
      1.15
      1.14
      215
      4
      4
      4
      0
      0
      0
    
    
      125
      E
      Glu-
      2.02
      3.63
      1.61
      216
      4
      4
      4
      0
      0
      0
    
    
      126
      R
      Arg+
      0.81
      1.81
      1.00
      217
      4
      4
      4
      0
      0
      0
    
    
      127
      D
      Asp-
      1.23
      3.64
      2.41
      218
      0
      0
      0
      0
      0
      0
    
    
      128
      P
      Pro
      0.45
      0.14
      -0.31
      219
      0
      0
      0
      0
      0
      0
    
    
      129
      Q
      Gln
      0.58
      0.77
      0.19
      220
      0
      0
      0
      0
      0
      0
    
    
      130
      S
      Ser
      0.13
      0.46
      0.33
      221
      0
      0
      0
      0
      0
      0
    
    
      131
      G
      Gly
      0.01
      1.15
      1.14
      222
      0
      0
      0
      0
      0
      0
    
    
      132
      I
      Ile
      -0.31
      -1.12
      -0.81
      223
      0
      0
      0
      0
      0
      0
    
    
      133
      Y
      Tyr
      -0.94
      -0.71
      0.23
      224
      0
      0
      0
      0
      0
      0
    
    
      134
      L
      Leu
      -0.56
      -1.25
      -0.69
      225
      0
      0
      0
      0
      0
      0
    
    
      135
      Q
      Gln
      0.58
      0.77
      0.19
      226
      5
      0
      5
      0
      0
      0
    
    
      136
      R
      Arg+
      0.81
      1.81
      1.00
      227
      5
      5
      5
      0
      5
      5
    
    
      137
      G
      Gly
      0.01
      1.15
      1.14
      228
      5
      5
      5
      0
      5
      5
    
    
      138
      L
      Leu
      -0.56
      -1.25
      -0.69
      229
      5
      5
      5
      5
      5
      5
    
    
      139
      I
      Ile
      -0.31
      -1.12
      -0.81
      230
      5
      5
      5
      5
      5
      5
    
    
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
      ...
    
    
      151
      F
      Phe
      -1.13
      -1.71
      -0.58
      242
      0
      0
      6
      6
      6
      6
    
    
      152
      D
      Asp-
      1.23
      3.64
      2.41
      243
      0
      0
      6
      6
      6
      6
    
    
      153
      L
      Leu
      -0.56
      -1.25
      -0.69
      244
      0
      0
      6
      6
      6
      6
    
    
      154
      F
      Phe
      -1.13
      -1.71
      -0.58
      245
      0
      0
      6
      6
      6
      6
    
    
      155
      G
      Gly
      0.01
      1.15
      1.14
      246
      0
      0
      6
      6
      6
      6
    
    
      156
      M
      Met
      -0.23
      -0.67
      -0.44
      247
      0
      0
      6
      6
      6
      6
    
    
      157
      S
      Ser
      0.13
      0.46
      0.33
      248
      0
      0
      6
      6
      6
      6
    
    
      158
      M
      Met
      -0.23
      -0.67
      -0.44
      249
      0
      0
      6
      6
      6
      6
    
    
      159
      A
      Ala
      0.17
      0.50
      0.33
      250
      6
      0
      6
      6
      6
      6
    
    
      160
      N
      Asn
      0.42
      0.85
      0.43
      251
      6
      6
      6
      6
      6
      6
    
    
      161
      G
      Gly
      0.01
      1.15
      1.14
      252
      6
      6
      6
      6
      6
      6
    
    
      162
      A
      Ala
      0.17
      0.50
      0.33
      253
      6
      6
      6
      6
      6
      6
    
    
      163
      H
      His0
      0.17
      0.11
      -0.06
      254
      6
      6
      6
      6
      6
      6
    
    
      164
      I
      Ile
      -0.31
      -1.12
      -0.81
      255
      6
      6
      6
      6
      6
      6
    
    
      165
      A
      Ala
      0.17
      0.50
      0.33
      256
      6
      6
      6
      6
      6
      6
    
    
      166
      G
      Gly
      0.01
      1.15
      1.14
      257
      6
      6
      6
      6
      6
      6
    
    
      167
      L
      Leu
      -0.56
      -1.25
      -0.69
      258
      6
      6
      6
      6
      6
      6
    
    
      168
      A
      Ala
      0.17
      0.50
      0.33
      259
      6
      6
      6
      6
      6
      6
    
    
      169
      V
      Val
      0.07
      -0.46
      -0.53
      260
      6
      6
      6
      6
      6
      6
    
    
      170
      G
      Gly
      0.01
      1.15
      1.14
      261
      6
      6
      6
      6
      6
      6
    
    
      171
      L
      Leu
      -0.56
      -1.25
      -0.69
      262
      6
      6
      6
      6
      6
      6
    
    
      172
      A
      Ala
      0.17
      0.50
      0.33
      263
      6
      6
      6
      6
      6
      6
    
    
      173
      M
      Met
      -0.23
      -0.67
      -0.44
      264
      6
      6
      6
      6
      6
      6
    
    
      174
      A
      Ala
      0.17
      0.50
      0.33
      265
      6
      6
      6
      6
      6
      6
    
    
      175
      F
      Phe
      -1.13
      -1.71
      -0.58
      266
      6
      6
      6
      6
      6
      6
    
    
      176
      V
      Val
      0.07
      -0.46
      -0.53
      267
      6
      6
      6
      6
      6
      6
    
    
      177
      D
      Asp-
      1.23
      3.64
      2.41
      268
      6
      6
      6
      0
      0
      0
    
    
      178
      S
      Ser
      0.13
      0.46
      0.33
      269
      6
      0
      0
      0
      0
      0
    
    
      179
      L
      Leu
      -0.56
      -1.25
      -0.69
      270
      0
      0
      0
      0
      0
      0
    
    
      180
      N
      Asn
      0.42
      0.85
      0.43
      271
      0
      0
      0
      0
      0
      0
    
  

71 rows × 12 columns



In [ ]:

    
b = a.groupby("group").sum()



In [ ]:



In [18]:

    
data.groupby("isHelix").sum()



In [20]:

    
data.groupby("isHelix2").sum()



In [22]:

    
data.groupby("isHelix3").sum()



In [40]:

    
# pd.options.display.max_rows = 999
# data



In [ ]:

    
data.groupby("isHelix").sum()



In [41]:

    
data.groupby("isHelix").sum()



In [32]:

    
a = data.groupby("isHelix").sum()[1:].reset_index()
a["group"] = (a["isHelix"]+1) // 2
b = a.groupby("group").sum()
b.drop(["resId", "isHelix"],axis=1).plot()



In [33]:



In [34]:



In [35]:

    
b



In [21]:

    
b



In [22]:

    
-4.59*1.6









    Out[22]:





-7.344



In [23]:

    
a.reset_index(drop=True)



In [24]:

    
b.drop(["resId", "isHelix"],axis=1).plot()









    Out[24]:





<matplotlib.axes._subplots.AxesSubplot at 0x1131ca9b0>



In [25]:

    
6*0.6









    Out[25]:





3.5999999999999996



In [26]:

    
b.drop(["resId", "isHelix", "Oct-IF"],axis=1).plot()









    Out[26]:





<matplotlib.axes._subplots.AxesSubplot at 0x1131b2860>



In [30]:

    
data = pd.read_feather("/Users/weilu/Research/data/pulling/GlpG_Hydrophobicity.feather")



In [ ]:

    
# data.join(zim123).to_feather("/Users/weilu/Research/data/pulling/GlpG_Hydrophobicity.feather")



In [31]:

    
data.plot("oneLetterCode", "DGwoct", kind="bar")
plt.show()



In [34]:

    
def V_membrane(z, kbin=0.2, memb=14.4):
    return 0.5*(np.tanh(kbin*(z+memb)) + np.tanh(kbin*(memb-z)))
kbin = 0.2
memb = 14.4
z = np.linspace(-30,30,100)
v = V_membrane(z, kbin, memb)
plt.plot(z,v)









    Out[34]:





[<matplotlib.lines.Line2D at 0x10bec39b0>]



In [35]:

    
def V_membrane(z, kbin=0.2, memb=14.4):
    return 0.5*(np.tanh(kbin*(z+memb)) + np.tanh(kbin*(memb-z)))
kbin = 0.4
memb = 14.4
z = np.linspace(-30,30,100)
v = V_membrane(z, kbin, memb)
plt.plot(z,v)









    Out[35]:





[<matplotlib.lines.Line2D at 0x10c6c4f98>]



In [33]:

    
V_membrane(-20)/V_membrane(0)









    Out[33]:





0.096822766552771625



In [34]:

    
V_membrane(-10)/V_membrane(0)









    Out[34]:





0.85854569921930957



In [ ]:

    
, (174, 192), (193, 213), (229, 241), (242, 267)



In [60]:

    
def isHelix6(id):
    helices_list = [(93,113), (132,163), (174, 190), (197, 213), (229, 241), (242, 267)]
    for count, (i, j) in enumerate(helices_list):
        if id >= i and id <= j:
            return 1+count
    return 0
data["resId"] = 91 + data.index
data["isHelix6"] = data["resId"].apply(isHelix6)



In [61]:

    
data.groupby("isHelix6").sum()



In [65]:

    
a = data.groupby("isHelix6").sum()[1:].reset_index()
a["group"] = (a["isHelix6"]+1) // 2
b = a.groupby("group").sum()
# b.drop(["resId", "isHelix"],axis=1).plot()
b[["DGwif", "DGwoct", "Oct-IF"]].plot()









    Out[65]:





<matplotlib.axes._subplots.AxesSubplot at 0x10bd82da0>



In [42]:

    
with open("/Users/weilu/Research/2xov_ca.dat", "r") as f:
    for line in f:
#         print(line)
        a = float(line.split()[-4])
#         print(a)
        i = int(line.split()[-7])
        if a > 14.4 or a < -14.4:
            c = 1
        else:
            c = 0
        print(i,a, c)









    



91 -20.024 1
92 -16.438 1
93 -13.538 0
94 -13.95 0
95 -11.664 0
96 -9.115 0
97 -8.906 0
98 -8.464 0
99 -5.973 0
100 -3.741 0
101 -3.67 0
102 -2.909 0
103 -0.142 0
104 1.537 0
105 1.457 0
106 2.909 0
107 5.696 0
108 6.387 0
109 6.738 0
110 9.091 0
111 11.163 0
112 11.493 0
113 12.486 0
114 14.848 1
115 15.794 1
116 14.667 1
117 17.527 1
118 16.809 1
119 13.197 0
120 14.113 0
121 16.415 1
122 13.255 0
123 10.542 0
124 12.284 0
125 11.966 0
126 14.548 1
127 17.939 1
128 20.115 1
129 19.649 1
130 19.492 1
131 16.201 1
132 14.362 0
133 12.065 0
134 11.046 0
135 7.757 0
136 6.338 0
137 8.974 0
138 7.271 0
139 4.474 0
140 5.737 0
141 7.741 0
142 4.381 0
143 4.146 0
144 7.254 0
145 7.27 0
146 10.242 0
147 8.846 0
148 5.791 0
149 4.578 0
150 5.035 0
151 2.823 0
152 0.336 0
153 -0.632 0
154 -0.484 0
155 -2.845 0
156 -5.207 0
157 -5.633 0
158 -5.835 0
159 -8.486 0
160 -10.571 0
161 -10.203 0
162 -9.658 0
163 -12.458 0
164 -14.843 1
165 -13.906 0
166 -14.281 0
167 -17.633 1
168 -19.251 1
169 -17.523 1
170 -16.331 1
171 -13.237 0
172 -12.287 0
173 -12.018 0
174 -9.709 0
175 -7.55 0
176 -6.934 0
177 -6.224 0
178 -3.767 0
179 -1.929 0
180 -1.572 0
181 -0.508 0
182 1.979 0
183 3.583 0
184 3.841 0
185 4.902 0
186 7.417 0
187 8.727 0
188 9.246 0
189 10.788 0
190 13.413 0
191 14.155 0
192 15.167 1
193 16.305 1
194 17.122 1
195 15.33 1
196 15.56 1
197 12.173 0
198 8.789 0
199 5.315 0
200 1.777 0
201 2.221 0
202 2.006 0
203 -1.204 0
204 -2.535 0
205 -1.85 0
206 -3.816 0
207 -6.725 0
208 -6.748 0
209 -6.867 0
210 -9.493 0
211 -11.85 0
212 -11.518 0
213 -11.987 0
214 -14.813 1
215 -16.675 1
216 -16.012 1
217 -17.139 1
218 -19.699 1
219 -21.363 1
220 -24.125 1
221 -21.515 1
222 -21.618 1
223 -17.829 1
224 -16.193 1
225 -13.465 0
226 -14.99 1
227 -13.925 0
228 -12.233 0
229 -10.384 0
230 -9.144 0
231 -7.311 0
232 -5.599 0
233 -4.85 0
234 -3.059 0
235 -1.119 0
236 -0.026 0
237 0.974 0
238 2.959 0
239 4.683 0
240 6.123 0
241 6.658 0
242 9.008 0
243 10.751 0
244 9.177 0
245 8.064 0
246 9.982 0
247 7.816 0
248 10.553 0
249 9.23 0
250 10.13 0
251 7.82 0
252 7.834 0
253 6.813 0
254 3.947 0
255 2.813 0
256 2.762 0
257 0.498 0
258 -1.754 0
259 -2.013 0
260 -3.28 0
261 -6.041 0
262 -7.039 0
263 -7.107 0
264 -9.291 0
265 -11.685 0
266 -11.846 0
267 -12.696 0
268 -15.274 1
269 -16.984 1
269 -16.977 1
270 -17.426 1
271 -18.943 1



In [ ]:

	DGwif	DGwoct	Oct-IF	resId	isHelix
isHelix4
0	7.99	23.32	15.33	4909	52
1	-0.53	-3.49	-2.96	2460	21
2	-10.73	-4.09	6.64	7980	44
3	-2.37	-4.54	-2.17	3477	57
4	-7.48	-5.80	1.68	4263	56
5	-6.77	-11.18	-4.41	3055	65
6	-2.92	-0.27	2.65	6617	108

	DGwif	DGwoct	Oct-IF	resId
isHelix
0	-5.40	8.75	14.15	10440
1	-3.53	-9.43	-5.90	2184
2	-6.16	-4.73	1.43	3465
3	-1.24	-0.13	1.11	3993
4	-1.46	2.35	3.81	3753
5	-5.37	-7.45	-2.08	3736
6	0.35	4.59	4.24	5190

	DGwif	DGwoct	Oct-IF	resId	isHelix
isHelix2
0	-4.51	11.63	16.14	11264	24
1	-3.54	-10.58	-7.04	2090	20
2	-6.85	-6.44	0.41	3487	42
3	-1.11	0.33	1.44	4186	66
4	-0.90	3.60	4.50	3553	68
5	-5.95	-8.22	-2.27	3510	75
6	0.05	3.63	3.58	4671	108

	DGwif	DGwoct	Oct-IF	resId	isHelix	isHelix2
isHelix3
0	0.59	4.29	3.70	2752	6	0
1	-0.53	-3.49	-2.96	2460	21	20
2	-10.74	-5.24	5.50	7810	44	44
3	-1.24	-0.13	1.11	3993	66	66
4	-3.83	2.60	6.43	5125	72	71
5	-5.37	-7.45	-2.08	3736	80	75
6	-1.69	3.37	5.06	6885	114	108

	DGwif	DGwoct	Oct-IF	resId
isHelix
0	0.59	4.29	3.70	2752
1	-0.53	-3.49	-2.96	2460
2	-10.74	-5.24	5.50	7810
3	-1.24	-0.13	1.11	3993
4	-3.83	2.60	6.43	5125
5	-5.37	-7.45	-2.08	3736
6	-1.69	3.37	5.06	6885

	oneLetterCode	AA	DGwif	DGwoct	Oct-IF
0	E	Glu-	2.02	3.63	1.61
1	R	Arg+	0.81	1.81	1.00
2	A	Ala	0.17	0.50	0.33
3	G	Gly	0.01	1.15	1.14
4	P	Pro	0.45	0.14	-0.31
5	V	Val	0.07	-0.46	-0.53
6	T	Thr	0.14	0.25	0.11
7	W	Trp	-1.85	-2.09	-0.24
8	V	Val	0.07	-0.46	-0.53
9	M	Met	-0.23	-0.67	-0.44
10	M	Met	-0.23	-0.67	-0.44
11	I	Ile	-0.31	-1.12	-0.81
12	A	Ala	0.17	0.50	0.33
13	C	Cys	-0.24	-0.02	0.22
14	V	Val	0.07	-0.46	-0.53
15	V	Val	0.07	-0.46	-0.53
16	V	Val	0.07	-0.46	-0.53
17	F	Phe	-1.13	-1.71	-0.58
18	I	Ile	-0.31	-1.12	-0.81
19	A	Ala	0.17	0.50	0.33
20	M	Met	-0.23	-0.67	-0.44
21	Q	Gln	0.58	0.77	0.19
22	I	Ile	-0.31	-1.12	-0.81
23	L	Leu	-0.56	-1.25	-0.69
24	G	Gly	0.01	1.15	1.14
25	D	Asp-	1.23	3.64	2.41
26	Q	Gln	0.58	0.77	0.19
27	E	Glu-	2.02	3.63	1.61
28	V	Val	0.07	-0.46	-0.53
29	M	Met	-0.23	-0.67	-0.44
...	...	...	...	...	...
151	F	Phe	-1.13	-1.71	-0.58
152	D	Asp-	1.23	3.64	2.41
153	L	Leu	-0.56	-1.25	-0.69
154	F	Phe	-1.13	-1.71	-0.58
155	G	Gly	0.01	1.15	1.14
156	M	Met	-0.23	-0.67	-0.44
157	S	Ser	0.13	0.46	0.33
158	M	Met	-0.23	-0.67	-0.44
159	A	Ala	0.17	0.50	0.33
160	N	Asn	0.42	0.85	0.43
161	G	Gly	0.01	1.15	1.14
162	A	Ala	0.17	0.50	0.33
163	H	His0	0.17	0.11	-0.06
164	I	Ile	-0.31	-1.12	-0.81
165	A	Ala	0.17	0.50	0.33
166	G	Gly	0.01	1.15	1.14
167	L	Leu	-0.56	-1.25	-0.69
168	A	Ala	0.17	0.50	0.33
169	V	Val	0.07	-0.46	-0.53
170	G	Gly	0.01	1.15	1.14
171	L	Leu	-0.56	-1.25	-0.69
172	A	Ala	0.17	0.50	0.33
173	M	Met	-0.23	-0.67	-0.44
174	A	Ala	0.17	0.50	0.33
175	F	Phe	-1.13	-1.71	-0.58
176	V	Val	0.07	-0.46	-0.53
177	D	Asp-	1.23	3.64	2.41
178	S	Ser	0.13	0.46	0.33
179	L	Leu	-0.56	-1.25	-0.69
180	N	Asn	0.42	0.85	0.43

	isHelix	DGwif	DGwoct	Oct-IF	resId
group
1	3	-14.28	-15.82	-1.54	9900
2	7	-5.07	2.47	7.54	9118
3	11	-7.06	-4.08	2.98	10621

	isHelix	DGwif	DGwoct	Oct-IF	resId
group
1	3	-10.39	-17.02	-6.63	5577
2	7	-2.01	3.93	5.94	7739
3	11	-5.90	-4.59	1.31	8181

	DGwif	DGwoct	Oct-IF	resId	isHelix	isHelix2	isHelix3	isHelix4	isHelix5
isHelix6
0	11.98	39.53	27.55	9627	69	63	117	73	22
1	-2.80	-7.68	-4.88	2163	20	19	21	21	21
2	-13.85	-15.36	-1.51	4720	34	32	64	64	64
3	-2.23	-5.63	-3.40	3094	51	51	51	51	51
4	-6.22	-5.46	0.76	3485	56	52	68	68	68
5	-6.77	-11.18	-4.41	3055	65	65	65	65	65
6	-2.92	-0.27	2.65	6617	108	102	156	156	156