C++ Academy | Telegram Webview: cpluspluc/1101 -

C++ Academy

⚙️ Задача для C++ разработчиков: «Непонятная ошибка, которая портит данные»

🎯 Цель: Найти и объяснить причину скрытого неопределённого поведения, которое проявляется не сразу

📍 Ситуация:

Ты разрабатываешь кроссплатформенное приложение на C++17, которое обрабатывает массивы бинарных данных.
На тестах — всё работает. Но у части пользователей (особенно на Linux) возникают:

- Повреждённые файлы после сериализации
- Непредсказуемые вылеты при больших объёмах данных
- Валидация данных случайно "съезжает" (байты путаются)

Вот фрагмент кода:


#include <vector>
#include <cstring>

struct Packet {
    uint32_t id;
    char data[64];
};

std::vector<uint8_t> serialize(const Packet& p) {
    std::vector<uint8_t> buffer(sizeof(Packet));
    std::memcpy(buffer.data(), &p, sizeof(Packet));
    return buffer;
}

🔍 Визуально всё нормально. В unit-тестах — ок. На CI — ок.
Но на проде данные иногда повреждены, и никто не может воспроизвести баг стабильно.

🧩 Задача:

1. Почему memcpy здесь небезопасен, хотя кажется логичным?
2. Что может отличаться на разных платформах и влиять на поведение?
3. Как бы ты безопасно сериализовал структуру в std::vector<uint8_t>?
4. Как это можно поймать с помощью valgrind / asan / -fsanitize=undefined?
5. Как написать cross-platform-safe сериализацию?

💡 Подсказка:

В C++ `struct Packet` может иметь **padding** и **alignment**, которые отличаются на архитектурах. `memcpy` по `sizeof(Packet)` может захватить лишние или мусорные байты.

🛠 Решение:

1. `struct Packet` не является POD-структурой с гарантированным layout — в ней может быть **неинициализированный padding**, который `memcpy` тоже копирует.

2. Проблема усиливается на системах с разным выравниванием: x86 vs ARM, GCC vs MSVC.

3. Более безопасный способ — сериализовать поля по отдельности:

std::vector<uint8_t> serialize(const Packet& p) {
std::vector<uint8_t> buffer;
buffer.insert(buffer.end(), reinterpret_cast<const uint8_t*>(&

p.id

),
reinterpret_cast<const uint8_t*>(&

p.id

) + sizeof(

p.id

));
buffer.insert(buffer.end(),

p.data

+ sizeof(

p.data

));
return buffer;
}

4. Или использовать `std::ostringstream` / `std::span` / `protobuf` / `flatbuffers`.

5. Проверка с `-fsanitize=undefined` даст warning:
```
memcpy: reading padding bytes from stack frame
```

📌 **Вывод:**
В C++ `memcpy` на структуру — это **ловушка**, если ты не контролируешь padding. Никогда не сериализуй структуры напрямую через память, если это не `#pragma pack` и не строго определённый layout.

💬 Это вопрос для собеседования на позицию C++ системного разработчика с уклоном в безопасность и низкоуровневую разработку.

@cpluspluc

www.tg-me.com/us/telegram/com.cpluspluc/1101

2.5K viewsJun 10 at 10:03

tg-me.com/cpluspluc/1101

Create: 2025-06-10
Last Update: 2025-06-16 16:36:25


#include <vector>
#include <cstring>

struct Packet {
    uint32_t id;
    char data[64];
};

std::vector<uint8_t> serialize(const Packet& p) {
    std::vector<uint8_t> buffer(sizeof(Packet));
    std::memcpy(buffer.data(), &p, sizeof(Packet));
    return buffer;
}