top of page

נגדיר מהי תוכנית מחשב: באופן בלתי פורמאלי זוהי סדרת פקודות לביצוע עבור מחשב. סדרת פקודות זו מתחילה ממקום קבוע מראש ומסתיימת באמצעות פקודות סיום שנכתבות על ידי המתכנת.
נגדיר מהי תוכנית בשפת ++c : תוכנית בשפת ++c היא תוכנית אשר אוסף הפקודות שבה שייכות לשפה מוסכמת מראש - שפת ++c. אוסף פקודות זה מוכר למתכנת ולתוכנה מסוימת הנקראת "מהדר לשפת ++c" או קומפיילר c ,אשר אחראי לתרגום התוכנית משפת c לתוכנית המכילה פקודות המוכרות למחשב. 

מבוא

היסטוריה

פיתוח השפה החל בשנת 1979 על ידי בְּיַאנֵה סְטְרוֹוסְטְרוּפ ממעבדות בל AT&T, כאשר הוא החל את עבודתו על הגרסה הראשונה בשמה C with classes (דהיינו "C עם מחלקות")[2]. סטרוסטרופ רצה ליצור שפה חדשה שתשלב את היתרונות של Simula, שפה מונחת עצמים איטית, יחד עם יתרונות היעילות והמהירות של שפת C.

בשנת 1983 זכתה השפה לשימוש במעבדות בל. בשנה זו נוספו לשפה כלים חדשים, בין היתר: פונקציות וירטואליות, העמסת פונקציות, העמסת אופרטורים, הפניות, קבועים, טיפוסיות חזקה והערות שורה (//). באותו זמן קיבלה השפה את שמה החדש ++C‏[3]. השם בא לבטא את העובדה ש-C++‎ היא הרחבה לשפת C. פלוס-פלוס הוא אופרטור הגדלה עצמית שקיים ב-C, הוא מגדיל ערך משתנה שלם ב-1. הגרסה המסחרית הראשונה הופצה בשנת 1985 יחד עם פרסום הספר הראשון לשפה מאת סטרוסטרופ, בשם "The C++ Programming Language"‏

בשנת 1989 עודכנה השפה ונוספו לה תכונות מסוג Protected ו-Static, ואפשרות לירושה מרובה‏[4]. לאורך השנים נוספו לשפה כלים חדשים, למשל תמיכה בתבניות נוספה רק בשנות ה-90. השפה תוקננה על ידי ארגון התקינה הבינלאומי בשנת 1998, לתקן C++ ISO/IEC 14882:1998‏. התקן השני לשפה יצא בשנת 2003 בו פורסמו מספר תיקונים לתקן הראשון‏.

התקן החדש לשפה,C++11, הידוע באופן לא רשמי כC++0x פורסם באופן רשמי ב-12 באוגוסט 2011‏. התקן מגדיר מאפיינים חדשים רבים מאוד לשפה, כולל פונקציות אנונימיות, רשימות אתחול משופרות ואתחול אחיד, ביטויי קבועים דמויי פונקציה, טיפוסים אוטומטיים, לולאות מבוססות טווח (לולאת "foreach"), ועוד מאפיינים רבים מאוד שנדרשו במשך השנים. השפה נמצאת בתהליך פיתוח מתמיד גם כיום.

 

עקרונות השפה

שפת C++‎ היא שפה מרובת פרדיגמות, כלומר היא משלבת כמה מודלים תכנותיים. השפה תומכת בתכנות פרוצדורלי כמו שפת C, ומוסיפה תמיכה בתכנות מונחה עצמים ובתכנות גנרי‏. ‏ ++C תוכננה כך שהיא שומרת על תאימות לאחור עם שפת C במידה רבה מאוד. ברוב המקרים, קוד הכתוב בשפת C יהודר וירוץ באותה דרך גם בעזרת מהדר של ++C, בעזרת שינויים מינוריים או ללא שינויים כלל.

כשפה מונחת עצמים, תומכת C++‎ בעקרונות כימוס, הורשה ורב־צורתיות (פולימורפיזם). מטרת כלים אלו היא לפשט את מבנה התוכנה, לאפשר שימוש חוזר בחלקי תוכנה קיימים ולהקל על תהליך הפיתוח. שימוש נכון בהם מאפשר לזהות שגיאות כבר בשלב ההידור ולחסוך את הצורך בגילויין ותיקונן בשלבים מאוחרים יותר של תהליך הפיתוח. C++‎ תומכת בירושה מרובה, המאפשרת למחלקה אחת לרשת משתי מחלקות ויותר, בניגוד לשפות מודרניות אחרות כגון C#‎ או Java. ‏ בניגוד לשפות אלו, ++C איננה שפה מונחית עצמים "טהורה", כלומר קיימים בה טיפוסים שאינם מחלקות, וניתן לכתוב בה פונקציות שאינן שיטות של מחלקה.

מבחינת התכנות הגנרי, מאפשרת C++‎ שימוש בתבניות (templates). התבניות מאפשרות כתיבת קוד כללי יעיל, ללא תלות בהיררכית הורשה. C++‎ תומכת בתבניות הן לפונקציות והן למחלקות. בנוסף, קיימת טכניקת תכנות בשם "Template Meta-Programming"‏ (TMP) המהווה בעצם "תת-שפה" נפרדת, פונקציונלית, המנצלת את התבניות על מנת לאפשר ביצוע חישובים מורכבים בזמן הידור.

בשל היותה מרובת פרדיגמות ניתן להשתמש ב-C++‎ ברמות שונות לאורך הקשת הנפרשת בין שפת C, שהיא שפה פרוצדורלית, לבין הכלים של תכנות מונחה עצמים ותכנות גנרי. השפה מאפשרת לשלב מספר פרדיגמות תכנות בתוכנית אחת.

C++‎‎ מתוכננת על מנת לשמור על היעילות והגמישות בהן מצטיינת שפת C, ולכן גם היא מהודרת על פי רוב ישירות לשפת מכונה (זאת בניגוד לשפות #C ו-Java המתורגמות לרוב לשפת ביניים המורצת על ידי מכונה וירטואלית). מנגנונים המוסיפים overhead מסוים (לדוגמה חריגות או RTTI) לא פוגעים בזמן הריצה אלא אם כן חל שימוש בהם.

 

מושגים בשפה

מרבית המושגים הבסיסיים בשפת C קיימים בצורה זהה או דומה מאוד גם בשפת ++C. להלן תוספות בשפת ++C שאינן קיימות בשפת C.

 

מחלקה

המחלקה (class) היא לב לבה של השפה. המחלקה היא תיאור של טיפוס הכולל נתונים ופעולות שאפשר לבצע על הנתונים. משתנים מסוג אותו טיפוס נקרא "עצמים" (objects). המחלקה כוללת משתנים (data members) ושיטות (member functions או methods). השיטות הן פונקציות שפועלות על המשתנים של המחלקה. שני סוגים חשובים של שיטות הן פונקציות הבנייה (Constructors) ופונקציית ההשמדה (Destructor) אשר תפקידן הוא לאתחל עצם מהמחלקה ולמחוק את תוכנו כאשר הוא נמחק.

 

הגבלת גישה

הגבלת הגישה לרכיבי המחלקה השונים מהווה כלי מרכזי למימוש עקרון הכימוס. ישנן שלוש רמות של הגבלות גישה:

  • פרטי (private) – רק שיטות המחלקה יכולות להשתמש בהם.

  • שמור (protected) – רק שיטות המחלקה ומחלקות שיורשות ממנה יכולות להשתמש בהם.

  • ציבורי (public) – לכולם יש גישה אליהם.

כמו כן ניתן להגדיר פונקציה או מחלקה מסוימת כחבר (friend). חברי המחלקה מקבלים גישה לכל המשתנים, השיטות והטיפוסים שמוגדרים במחלקה, גם לפרטיים וגם לשמורים.

 

הורשה

ניתן להגדיר מחלקה נורשת ("derived class") על סמך מחלקה אחרת, בסיסית ("base class"). המחלקה הנורשת מכילה אוטומטית את המשתנים, השיטות ושאר רכיבי המחלקה הבסיסית ובנוסף מגדירה כאלו משל עצמה. לעומת שפות מודרניות אחרות שמתבססות עליה, C++‎ תומכת בהורשה מרובה, כלומר ירושה ממספר מחלקות בו זמנית.

כאשר מורישים תכונות למחלקה אחת ממחלקה שנייה ניתן לעשות זאת באחת משלוש דרכים:

  • הורשה ציבורית – יורשת את כל המשתנים, השיטות והטיפוסים באותה רמת הגישה.

  • הורשה שמורה – המשתנים, השיטות והטיפוסים הציבוריים של מחלקת האב מקבלים הרשאת גישה שמורה (protected) במחלקת הבן.

  • הורשה פרטית – המחלקה הנגזרת וחבריה הם היחידים שיכולים להשתמש בתכונות של מחלקת האב. כל התכונות הללו הופכות לפרטיות במחלקת הבן.

ניתן להתייחס לעצם דרך מצביע או ייחוס (Reference) למחלקה בסיסית, ולהפעיל שיטות של העצם בלי לדעת מראש את הטיפוס המדויק שלו. שיטות כאלו מוגדרות "וירטואליות". הן ניתנות להפעלה על ידי התייחסות לעצם ממחלקה בסיסית אך בפועל מבוצעת השיטה במחלקה הנורשת, בהתאם לסוג העצם עבורו הופעלה השיטה. זהו סוג מסוים של פולימורפיזם (הסוג האחר הוא תכנות גנרי בעזרת תבניות - ראה בהמשך).

מנגנון ה־Run-Time Type Information (‏RTTI) מאפשר לקבל מידע על הטיפוס של העצם הנתון, תוך כדי ריצת התוכנית. מנגנון זה מגדיר את האופרטור dynamic_cast שמאפשר לבצע המרה בטוחה בין מצביע (הוא הפנייה) למחלקת בסיס לבין מצביע למחלקה הנגזרת. אופרטור זה מאפשר לבדוק האם העצם הנתון הוא מטיפוס מסוים או לא. אופרטור נוסף שנוסף לשפה במסגרת ה-RTTI הוא אופרטור ה-typeid. אופרטור זה מאפשר לקבל את הטיפוס המדויק של העצם הנתון.

לעומת שפות אחרות, כמו C#‎ לדוגמה, ב-C++‎ אין הבדל בין מחלקות (class) לבין מבנים (struct). גם מחלקות וגם מבנים יכולים להכיל שיטות, לרשת האחד מהשני, להגדיר פונקציות וירטואליות ולהגדיר רמות גישה שונות. ההבדל היחיד הוא שתכונות המבנה מוגדרות ציבוריות כברירת מחדל ואילו תכונות המחלקה כפרטיות.

 

טיפוסיות חזקה

מערכת הטיפוסים בשפה חזקה יותר מזו שבשפת C, בה המהדר מבצע המרות טיפוסים בצורה אוטומטית ובקלות יחסית, ובה ניתן להשתמש במצביע *void שיכול להצביע אל אובייקט מכל טיפוס.

בשפת C++‎ הוקשחו הכללים והמרות טיפוסים מובלעות נעשות רק לפי הגדרות המובנות בשפה או כאלה שהוגדרו על ידי המשתמש. שימוש ב *void דורש המרה מפורשת, ולכל סוג של המרה ישנו אופרטור מפורש מתאים (static_cast, dynamic_cast, const_cast, reinterpret_cast). תכונה זו מאפשרת גילוי שגיאות רבות יותר בשלב ההידור וחוסכת את מציאתן המייגעת בזמן הריצה.

בשל הגישה הכללית של השפה לאפשר למתכנת לבצע כל פעולה, בתנאי שברור שהוא באמת מעוניין בכך, הטיפוסיות בשפה בטוחה פחות מאשר בשפת Java, למשל.

 

הגדרת הקבוע

את הגדרת הקבוע const ניתן להצמיד למשתנה של מחלקה, לפרמטר של שיטה, לפרמטר של פונקציה, לערך המוחזר מהן וכן לשיטה עצמה. הגדרה זו מאפשרת למהדר לגלות שימוש סותר להגדרה. לדוגמה: שיטה שהוגדרה כקבועה ומשנה את העצם עליו היא פועלת (שגיאה), פרמטר שהועבר כקבוע ומושם לתוכו ערך (שגיאה). על ידי שימוש בכלי זה ניתן לגלות שגיאות כבר בשלב ההידור. הגדרת ה הקבוע const משתלבת, למעשה, כחלק ממערכת הטיפוסים.

על מנת להשתמש בהגדרת הקבוע const נדרשים דיוק, מחשבה ולעתים מאמץ נוסף אשר משתלמים אם מדובר בקוד המיועד לשימוש חוזר (reuse) תוך מניעת שגיאות וגילויין מוקדם ככול האפשר. יש מתכנתים העלולים להתלונן על כך. לדוגמה:

  • ישנן שיטות, כגון אופרטור האינדקס (סוגריים מרובעים []) שצריכות להתאפשר בצורה שונה מעט עבור אובייקטים שהם const או שאינם כאלה. הדבר מביא לעתים לשכפול קוד - עד כדי כתיבה של אותה פונקציה בדיוק, פעמיים; פעם כשהיא const ופעם ללא const. מתכנתים מנוסים יידעו להתגבר על כך ללא קושי (לכל היותר מדובר בשורת הגדרה כפולה), אם כי מתחילים עלולים להגרר ל"שבירת" מערכת הטיפוסים - שימוש ב const_cast.

  • ה-const מוגדר כ bitwise-const - כלומר, המהדר מנסה לוודא שאף ביט של האובייקט לא ישתנה. עם זאת, המצב הרצוי הוא אי שינוי של המצב של האובייקט, אך שינוי של ביטים איננו גורר בהכרח שינוי מצב. כך למשל אובייקט המעוניין לשמור מטמון (cache) תוך כדי ביצוע של שיטה המוגדרת const לשם שיפור הריצה בקריאה הבאה, לא יכול לעשות זאת באופן ישיר, כי מבחינת השפה מדובר כאן בשינוי המצב של האובייקט. זאת, אף שאין כל שינוי אמיתי במצב, מבחינת התנהגות האובייקט בעתיד. בתקן החדש ישנו פתרון חלקי לבעיה הזאת. שימוש בהגדרה כ-mutable מאפשר להגדיר ולשנות משתני מטמון (cache) תוך כדי ביצוע של שיטה המוגדרת const.

מנגד, על פי הכלל הידוע בשפה לפיו סומכים על המתכנת שהוא יודע מה הוא עושה, הגדרת אובייקט כ-const עדיין מאפשרת לאובייקט לשנות את המצב של עצמו דרך מצביעים, בשימוש ב const_cast וכדומה.

 

משתנה ייחוס (reference variable)

ניתן להגדיר משתנים, פרמטרים וערכים מוחזרים כמתייחסים לעצם (reference). הייחוס דומה מאוד להצבעה: כמה משתנים יכולים להתייחס לאותו עצם ולפעול עליו במשותף, כמו שמצביעים שונים יכולים לפעול על אותו עצם. ישנם מספר הבדלים בין מצביע לייחוס: מצביע יכול להיות ריק (NULL) ואילו ייחוס תמיד יתייחס לעצם כלשהו. כמו כן ניתן לשנות הצבעה של מצביע אבל לא ניתן לשנות ייחוס, הייחוס נקבע לכל אורך חייו של משתנה הייחוס. מבחינה תחבירית השימוש בייחוס הוא כמו בעצם עצמו ללא האופרטורים * ו <-.

 

העמסת פונקציות

העמסת פונקציות הינה היכולת להשתמש באותו השם לפונקציות (או שיטות) שונות, בתנאי שישנו הבדל ביניהן במספר הפרטרים או בטיפוסי הפרמטרים אותם הן מקבלות. הדבר מאפשר להגדיר מספר רב של פונקציות שמבחינה לוגית מבצעות פעולה דומה אך מקבלות פרמטרים שונים. תכונה זו מאפשרת לכתוב קוד קריא יותר, אם כי הגזמה בהעמסת פונקציות עשויה ליצור אי-בהירות או מקרים של דו-משמעות.

 

פרמטרים אופציונאליים

דרך נוספת להעמיס פונקציות היא להגדיר ערכי ברירת מחדל לפרמטרים של שיטה או פונקציה. אם מתבצעת קריאה לפונקציה שאיננה כוללת ערך עבורם, הם יקבלו את ערך ברירת המחדל. כך ניתן בקלות להגדיר פעולה זהה עבור מספר שונה של פרמטרים, מבלי לבצע שכפולי קוד.

כאמור, ניתן לכתוב ב ++C על כל הקשת מתכנות פרוצדורלי עם טיפוסיות חלשה בדומה לשפת C, ועד לניצול פרדיגמות התיכנות המודרניות ביותר. מסיבה זו ניתן, אך לא מומלץ, לכתוב פונקציות המקבלות מספר בלתי מוגדר מראש של פרמטרים, על ידי שימוש בשלוש נקודות (...) בחתימת הפונקציה. תכונה זו קיימת רק על מנת להקל על הגירה של תוכניות משפת C לשפת ++C. את ה-printfשל C, שהיא דוגמה לפונקציה עם מספר פרמטרים משתנה (...), מחליפות ב ++C מחלקות כגון iostream המאפשרות לשרשר פרמטרים להדפסה תוך שימוש בהעמסת אופרטורים וטיפוסיות חזקה.

 

העמסת אופרטורים

בשפה קיים מנגנון העמסת אופרטורים. כלומר, ניתן להגדיר מחדש כמעט כל אופרטור זמן ריצה המוגדר בשפה כך שהוא יהיה בעל משמעות עבור טיפוסים שונים, כולל טיפוסים המוגדרים על ידי המשתמש. למשל, אופרטור החיבור (+) בצורתו הרגילה מאפשר חיבור שני משתנים המכילים ערך מספרי. אך ניתן להגדיר אותו כך שיהיה בעל משמעות גם עבור משתנים מטיפוס שבר שהוגדר על ידי המתכנת.

אין כל הבדל סמנטי בין העמסת אופרטורים להעמסת פונקציות. אך מבחינת תחבירית העמסת אופרטורים היא תכונה שנויה במחלוקת, כיוון שהיא מאפשרת להעמיס אופרטורים ללא התייחסות למשמעות הטבעית והמקובלת שלהם; במיוחד, דבר זה עלול ליצור בעיות בעת כתיבת תבניות (templates), בהם לא ניתן לדעת מה יהיה הטיפוס שיועבר כפרמטר. דוגמה להעמסה שנויה במחלוקת היא העמסת אופרטור החיבור + כך שיאפשר שרשור מחרוזות, עבור המחלקה string. שרשור מחרוזות, בניגוד לחיבור רגיל, איננו מקיים את חוק החילוף. וכך בדוגמה הבאה המתכנת עשוי שלא להיות מודע לתוצאות של החלפת סדר המשתנים באופרטור:

 

 

 

 

 

 

 

 

 

 

החלפת המקומות בין הפרמטרים y, x לא תשנה דבר במקרה של הקריאה הראשונה, עבור מספרים שלמים, והיא תחזיר את התוצאה הצפויה 3. אבל עבור הקריאה של המחרוזת הפונקציה מחזירה "worldhello" ולא "helloworld" - אולי לא מה שהמתכנת שכתב את הקוד התכוון שיקרה.

מצד שני, יש להעמסת אופרטורים יתרונות, כאשר היא מבוצעת בטעם, והיא עשויה לשפר את קריאות הקוד.

 

תבניות

שפת C++‎ תומכת ב־templates – תבניות. התבניות מהוות רמת הפשטה נוספת מעל רמת ההפשטה של המחלקה. הן מאפשרות יצירת מחלקות או פונקציות על ידי תבנית, כאשר בכל פעם הפונקציה או מחלקה נוצרת עבור טיפוס או טיפוסים אחרים. ה"טיפוס" הוא טיפוס פשוט או מחלקה בעצמו. הטיפוסים "מועברים" בכמעין פרמטר על ידי שימוש בסוגריים זוויתיים: "<...>" במקום השימוש ב "(...)" הרגילים. המהדר מזהה אילו פרמטרים הועברו לתבנית ומשכפל את התבנית בהתאם.

Template Metaprogramming 

ישנה טכניקת תכנות בשם "Template Metaprogramming" או בקיצור TMP, המנצלת את התבניות על מנת לבצע חישובים מורכבים בזמן ההידור, ובכך עשויה להפחית את החישובים שיש לבצע בזמן ריצה.

טכניקה זו נתגלתה במקרה: במהלך הכנת התקן של שפת ++C, התברר שהתבניות של השפה הן בעצמן תת-שפה שלמה טיורינג, כלומר שניתן לבצע באמצעותה כל חישוב שיכול מחשב לבצע. הדוגמה הראשונה לתוכנית כזאת ביצעה חישוב של מספרים ראשוניים על אף שלא סיימה לעבור הידור. הרשימה של המספרים הראשוניים הייתה חלק מהודעת השגיאה שהפיק המהדר בזמן שניסה להדר את הקוד.

כיום ישנן ספריות רבות המסייעות לעבודה בטכניקה זו, אך כיוון שמלכתחילה לא הייתה כוונה ליצור את תת-השפה הזאת בתוך ++C, התחביר שלה קשה להבנה. להלן דוגמה לקטע קוד שמבצע חישוב של עצרת:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ספרית התבניות התקנית

ספריית התבניות התקנית (STL - Standard Template Library‎) מכילה מימושים יעילים של מבני נתונים רבים כגון (מחסנית, רשימה מקושרת, עץ חיפוש מאוזן ועוד), וכן טיפוסי נתונים סטנדרטיים חשובים כמו וקטור (מערך דינמי) ומחרוזת. הספרייה גם מכילה אלגוריתמים גנריים שניתן להפעיל על מבני הנתונים כמו גם מחלקות לטיפול במספרים ובקלט־פלט. הארכיטקטורה של הספרייה מאפשרת להרחיב אותה בקלות יחסית. ניתן להוסיף אלגוריתם חדש שפועל על מבני הנתונים הקיימים ומבנה נתונים חדש שהאלגוריתמים הקיימים עובדים עליו.

תוספות אלו, תורשה מרובה (1989), העמסת אופרטורים (1989), תבניות (1991), ספרית התבניות הסטנדרטית ו־RTTI ‏(1995) הוכנסו לשפה בהדרגה.

 

קלט ופלט

הקלט והפלט מתבצעים בשפה על ידי stream-ים מהם מבצעים קריאה באמצעות האופרטור << וכתיבה באמצעות האופרטור >>. טיפוסים אלו מוגדרים בעיקר באמצעות הספריות iostream (קלט/פלט סטנדרטי) ו-fstream (קלט/פלט באמצעות קבצים) ובמרבית המהדרים על ידי ספריות נוספות.

דוגמה לשימוש בהגדרת הקלט הסטנדרטי cin והפלט הסטנדרטי cout:

 

 

int x; cout << "please enter a number: ";

cin >> x;

 

בדוגמה התוכנית תדפיס את הבקשה, ותמתין לקבלת מספר שלם.

 

Hello World

דוגמה לתוכנית Hello world בשפת C++‎:

 

 

 

template <typename T>

T add(T x, T y)

{

    return y+x;

}

int z = add<int>(1,2);

string s = add<string>("hello", "world");

template <int N>

struct Factorial 

{

    enum { value = N * Factorial<N - 1>::value };

};

 

template <>

struct Factorial<0> 

{

    enum { value = 1 };

};

 

// Factorial<4>::value == 24

// Factorial<0>::value == 1

 

void foo()

{

    int x = Factorial<4>::value; // == 24

    int y = Factorial<0>::value; // == 1

}

 

#include <iostream>

 

using namespace std;

 

int main()

{

    cout << "Hello, world!" << endl;

 

    return 0;

}

 

bottom of page