SAS2PYTHON - Exportieren von CSV- oder Excel-Dateien


Posted on 20 September 2022 at 15:00 by Stefan Weingaertner

In der Episode 24 unseres heutigen Blog-Beitrags zeigen wir, wie man in SAS/BASE und in Pandas Daten im CSV- oder Excel-Format exportieren kann.



Ein Pandas DataFrame ist einem SAS Data Set sehr ähnlich - es handelt sich um eine zweidimensionale tabellarische Datenstruktur mit gelabelten Spalten, die von unterschiedlichem Datentyp sein können. Wie in diesem Beitrag gezeigt wird, kann nahezu jede Operation, die mit dem SAS Data Step auf einen Datensatz angewendet werden kann, auch in Pandas ausgeführt werden.


Die zu exportierende Datei hat 6 Zeilen und 3 Spalten und sieht wie folgt aus:


                      
                   Name  Department         Position 
           Vincent Vega       Sales        Executive 
      Marsellus Wallace   Marketing        Executive
         Butch Coolidge          HR        Executive
            Honey Bunny          IT  Project Manager
   Esmeralda Villalobos  Purchasing        Assistant
        Jules Winnfield     Finance        Team Lead
                    


SAS-Code: Das Exportieren von CSV- oder Excel-Dateien würde man für ein SAS Dataset "df" wie folgt umsetzen.


                      
/* Export eines SAS Data Set als CSV-Datei */

proc export data= df  
    outfile = "user/hr.csv"
    dbms=csv
    replace;
run;

/* Export eines SAS Data Set als Excel-Datei */

proc export data= df
    outfile = "user/hr.xlsx"
    dbms=xlsx 
    replace;
    sheet = "sheet1";
run;
                    




Python-Code: In Python würde man das Exportieren in ein CSV- oder Excel-Format für ein Pandas Dataframe "df" mit der folgenden Syntax umsetzen.


                      
import pandas as pd

# Export eines Pandas Dataframe als CSV-Datei

df.to_csv("user/hr.csv")	

# Export eines Pandas Dataframe als Excel-Datei

df.to_excel("user/hr.xlsx", sheet_name = "sheet1", index = False)
                    

Hinweis: sollte bei der Ausführung der "to_excel"-Funktion der folgende Fehler auftauchen,

ModuleNotFoundError: No module named ‘openpyxl’

so müsste mit PIP die Bibliothek "openpyxl" wie folg installiert werden:


                      
pip install openpyxl
                    




Wenn Sie die nächste Episode nicht abwarten möchten, können Sie auch gerne unser umfangreiches Training Python für SAS Professionals buchen.

Informationen zu den nächsten Kursterminen und zu unserem gesamten Trainingsangebot finden Sie hier.