Danas se količina podataka znatno povećava, a podatcima se pridaje sve veća vrijednost, kao i poznavanju njihove manipulacije i crpljenja vrijednih informacija. Poznat primjer crpljenja informacija ...je pretraživanje poznatih kemijskih spojeva i dizajniranje novih spojeva na osnovi znanja iz modela u svrhu istraživanja potencijalnih lijekova. Stoga je studentu kemije važno biti dobro pripremljen za trenutačno digitalno doba, gdje nije više dovoljno biti samo spretan u laboratoriju, nego je potrebno znati modelirati i raditi s podatcima. Ovaj rad pokriva osnove molekulskog modeliranja i QSAR-a te osnove rukovanja podatcima pomoću besplatnog programskog jezika Python i njegove biblioteke za molekulsko modeliranje RDKit. Ostale Pythonove biblioteke koje će se primjenjivati u radu su Pandas, za rukovanje i obradu svih vrsta podataka; statsmodels, Numpy, Scipy i SKLearn za matematičke i statističke operacije te linearnu algebru i Matplotlib i Seaborn za ispisivanje grafova. Programski jezik Python je sa svojim navedenim bibliotekama integriran u program Anaconda. Anaconda korisniku omogućuje jednostavnu primjenu i upravljanje bibliotekama te upotrebu sučelja Jupyter Notebook za programiranje i ispis grafičkih prikaza i rezultata analiza. U ovom, prvom dijelu rada analizirat će se problem predviđanja topljivosti u vodi na skupu organskih kemijskih spojeva pomoću univarijatne linearne regresije. Cilj rada je približiti kemičarima programiranje u jeziku Python, primjenu njegovih biblioteka i praktično rješavanje problema u molekulskom modeliranju.
Ovo djelo je dano na korištenje pod licencom Creative Commons Imenovanje 4.0 međunarodna .
Full text
Available for:
IZUM, KILJ, NUK, PILJ, PNG, SAZU, UL, UM, UPUK
U radu je predstavljen novi i jednostavniji model za procjenu vrijednosti prvog oksidacijskog potencijala, Ep1, flavonoida, koji se temelji na broju fenolnih, alkoholnih i karboksilnih OH skupina. U ...regresiju smo uključili prve oksidacijske potencijale 12 polifenola (uglavnom flavonola i katehina) mjerene u našem laboratoriju pri pH 3. Model je dao r=0,986 i SE=0,040. Nakon uključivanja sedam ranije objavljenih Ep1 vrijednosti, mjerenih pri pH 3, u regresiju, model daje r=0,980 i SE=0,046 (N=19), a nakon uključivanja njih još 19, mjerenih pri pH 7 (N=38), r=0,985, SE=0,044.