El documento describe las cuatro fases del preprocesador de C: 1) tokenizado léxico, 2) empalmado de líneas, 3) tokenización, y 4) preprocesado. En la primera fase, los trigrafos y dígrafos se traducen a sus caracteres equivalentes. En la segunda fase, las líneas físicas se unen en líneas lógicas. En la tercera fase, el código se reduce a tokens separados por caracteres de separación. En la cuarta fase, se ejecutan las instrucciones "include" y se