Weitere ähnliche Inhalte
Ăhnlich wie GraphPad Prism: Curve fitting (20)
Mehr von Bioinformatics and Computational Biosciences Branch (20)
KĂźrzlich hochgeladen (20)
GraphPad Prism: Curve fitting
- 4. 3/29/2010
4
Polynomial Regression
binding = ď˘0 + ď˘1 ď (ligand) + ď˘2 ď (ligand2) + ⌠+ ďĽ
⢠Fits a curved relationship using aÂ
linear model
⢠Degree of polynomial indicatesÂ
the number of curves
â Quadratic (1 curve)
â Cubic (2 curves)
⢠High degree polynomials are bestÂ
fit by ANOVA models
Logâtransformations
growth = ď˘0 ď exp{-ď˘1 ď age} ď ďĽ or ln(growth) = ln(ď˘0) - ď˘1 ď age + ln(ďĽ)
⢠Imagine growth modeled by anÂ
exponential equation withÂ
multiplicative error
â I.e. errors get smaller as growthÂ
decreases with increasing age
⢠Log transformation is often usedÂ
to âcorrectâ a curved exponentialÂ
relationship
- 5. 3/29/2010
5
Nonlinear Regression
⢠Describes a nonlinear relationship between predictorÂ
d i li tiand response using nonlinear equations
â E.g.Â
⢠Least squares equations do not have a closed formÂ
solution (i.e. cannot use calculus to find estimates)
Response ď˝ Bottomď
Top ď Bottom
1ďŤ10 log EC50ďlogXď¨ ďŠďHillslope
( )
⢠Estimates are found using iterative methods
â Pick initial values and converge to solution stepâbyâstep
Iterative Methods
⢠Linear descent method starts with an initial value, thenÂ
âstepsâ away to minimize sums of squares (SS)steps  away to minimize sums of squares (SS)
â If first positive step increases SS, step backwards
â If nth step increases SS, take smaller steps
â Linear descent is best for first steps from initial value
⢠GaussâNewton uses matrix algebra to minimize SS, as if itÂ
were a change in âslopeâ from the initial value
â GaussâNewton is best for the last steps of minimization
⢠LevenbergâMarquardt method starts with linear descentÂ
and switches to GaussâNewton
- 7. 3/29/2010
7
DoseâResponse Models
⢠Most commonly used modelÂ
among NIAID researchers
log-dose vs response
500
⢠Up to five parameters
â TOP and BOTTOM
â Log(EC50)
â Hillslope (default = 1)
â Symmetry (default = 1)
-10 -8 -6 -4 -2
-100
0
100
200
300
400
500
No inhibitor
Inhibitor
log[Agonist], M
⢠Concepts presented for doseâ
response models will apply to allÂ
other nonlinear models Response ď˝ Bottomď
Top ď Bottom
1ďŤ10 logEC50ďlogXď¨ ďŠďHillslope
Getting Started in PRISM
⢠Open a XY data table andÂ
enter data
⢠Transform and normalizeÂ
data if necessary
⢠Open the nonlinear fitÂ
menu in PRISM
- 8. 3/29/2010
8
Why Use log(X) For Sigmoid Dose Response?
⢠Raw X values produce a
dose vs. response
500
Raw X values produce aÂ
hyperbolic curve
â Large errors at the ascent
â Small errors at the plateau
⢠Log(X) values produce a log dose vs response
0.0000 0.0001 0.0002 0.0003 0.0004
0
100
200
300
400
No inhibitor
Inhibitor
Dose
Response
sigmoid âesseâ curve
â Moderate errors throughout
â Best estimates of EC50
log-dose vs response
-10 -8 -6 -4 -2
-100
0
100
200
300
400
500
No inhibitor
Inhibitor
log[Dose]
Response
Importance of Log Transform
- 9. 3/29/2010
9
Choose a Model
⢠Choose an equation from the Fit
tab of the nonlinear mentab of the nonlinear menu
⢠Equations are grouped byÂ
experiment types
â E.g. doseâresponse, binding, âŚ
⢠Click the details button to viewÂ
the actual equation and a sampleÂ
graph of the model
Fitting Methods
⢠Use Least Squares (LS) whenever possible
â LS produces the correct tests using all data
⢠Use Automatic Outlier Elimination or Robust FitÂ
when outliers influence your results
â Robust Fit uses all of your data, but cannot produce y , p
confidence intervals or tests
â Automatic Outlier Detection removes data andÂ
applies least squares methods
- 12. 3/29/2010
12
Goodness of Fit Tests
⢠Coefficient of determination (R2) is the percent ofÂ
variation explained by the model
â Remember R2 is only meaningful if the modelÂ
assumptions have been met
â Typically used to compare valid models
⢠Sums of squares (SS) and standard deviation ofÂ
the residuals (sy.x) are more descriptive
â Bigger SS implies model is more informative
â Smaller sy.x implies model has smaller errors
Normality Tests
⢠DâAgostinoâPearson Omnibus test
Tests the magnitude of skewness and kurtosis statistics toâ Tests the magnitude of skewness and kurtosis statistics toÂ
determine if errors are normal
⢠ShapiroâWilk test
â Uses ranks to compare errors to normal distribution
⢠KolmogorovâSmirnov test     (historical use only)
â Tests the magnitude of the largest difference between twoÂ
empirical cdf plots
- 13. 3/29/2010
13
Runs Tests and Replicates TestsÂ
⢠Does the curve systematicallyÂ
diff f b d i t ?differ from observed points?
⢠Use replicates test for replicatedÂ
curveâfit data
â Compare error between points andÂ
curve to error among reps
⢠Use runs test for nonâreplicated p
curveâfit data
â Tests the largest ârunâ of pointsÂ
above or below the curve
Notice the largest run
of 3 points above the
curve suggests model
is incorrect
Residual Plots
⢠Residuals are the errorsÂ
between points and curvebetween points and curve
⢠Want to find independent andÂ
identically distributed randomÂ
normal errors
⢠Look for nonârandom trendsÂ
and nonâconstant variance
- 14. 3/29/2010
14
Improving Model Fit
⢠Change the initial values to aid convergence
⢠Limit the range of X or Y to eliminate outliersÂ
⢠Add constraints to force the model to meet certainÂ
criteria that improve model fit
â E.g. Bottom = 0%, Top = 100%, âŚ
⢠Use a weighting scheme to combat nonâconstantÂ
variance or emphasize parts of the curve
Initial Values and Range
⢠Change the initial values of the parameters, if theÂ
model does not converge
â Try the âDonât Fit Curveâ option on the diagnostics tab to findÂ
better initial values
⢠Select the range of X values used curveâfit to eliminateÂ
outliers or invalid data pointsoutliers or invalid data points
⢠Select the range of the fitted curve to complete theÂ
graphs and figures, if necessary
- 15. 3/29/2010
15
Model Constraints
⢠Add hard or soft constraintsÂ
to a model parameter
â Bottom = 0
â Top â¤Â 100 %
⢠Improve model fit if dosesÂ
are poorly chosen, etc.
â Not enough low doses
â Doses too low for saturation
Weights
⢠Use 1 / SD2 weights for nonâconstant variance
â Requires many replicates per X
⢠Use other weight schemes to apply unequal weights toÂ
one part of the curve
â Use 1 / Y2 for larger errors at the highest responses
â Use 1 / X to emphasize values on the left of the graph