D.1. Formaty danych
D.1.1. Format danych CSV
Format CSV (ang. Comma Separated Values) to plik zawierający dane tabelaryczne zapisane jako wartości rozdzielane przecinkiem. Jest to format przechowywania danych w plikach tekstowych. Według standardu, wartości powinny być rozdzielone przecinkami (zwanego znakiem rozdzielający), lecz dopuszcza się stosowane np. znaków średnika lub tabulatora.
W pliku CSV każdy "wiersz tabeli" jest jednocześnie końcem wiersza w tym plik. Dla ułatwienia ich rozpoznania przez użytkowników, nazwy plików z danymi CSV posiadają zazwyczaj rozszerzenie csv, rzadziej txt.
Plik CSV może posiadać nazwy kolumn umieszczone w jego pierwszym wierszu. Przy importowaniu go do progamu (np. do Kexi) należy wtedy wkazać, że chcemy pierwszy wiersz pliku potraktować jako wiersz zawierający nazwy kolumn. Znakomicie ułatwia to pracę, ponieważ nie trzeba ręcznie poprawiać nazw kolumn.
Kodowanie znaków
Kodowanie znaków (np. ISO lub Windows CP) w pliku CSV jest zależne od systemu operacyjnego na którym aktualnie pracujesz. Bardziej wymienny jest standard ISO. Program Kexi umożliwia wybrania kodowania znaków podczas import oraz eksportu danych CSV. Informacje o kodowaniu nie są zapisane w pliku, więc przy otwieraniu go (np na innym komputerze) należy wybrać odpowiednie kodowanie.
Przykład
Oto zawartość przykładowego pliku kontakty.csv w formacie CSV odpowiadająca tabeli danych z rozdziału 1.1. Czym jest baza danych?:
Imię,Tel
Joanna,699 23 43 12
Adam,711 19 77 21
|
W pierwszym wierszu zawiera on nazwy kolumn. Po wstawieniu tych danych do Kexi można uzyskać następującą tabelę Kontakty:
| Imię | Tel |
| Joanna | 699 23 43 12 |
| Adam | 711 19 77 21 |
Oprócz wspomnianego znaku rozdzielającego, dane CSV mogą korzystać z cudzysłowu w celu oznaczenia danych tekstowych. Jeśli jakiś fragment tekstu zawiera np. przecinek, wtedy potrzebne jest opatrzenie go cudzusłowiem.
"Imię i nazwisko","Adres"
"Joanna Kowalska","ul. Marszałkowska 1, Warszawa"
"Adam Kamiński","ul. Dolna 122"
|
Gdyby w powyższym przykładzie nie użyto cudzysłowu, kolumna "ul. Marszałkowska 1, Warszawa" byłaby traktowana jako dwie kolumny, co doprowadziłoby do błędu w interpretacji danych. Podobna sytuacja następuje gdy w danej kolumnie znajduje się wielowierszowy tekst.
W Kexi do wszystkich parametrów dotyczących formatu CSV masz dostęp podczas importowania lub eksportowania danych CSV; zobacz sekcję 7.2.1. Importowanie plików w formacie CSV
oraz 7.4.1. Eksportowanie danych do plików w formacie CSV.